AI nhận dạng giọng nói của Google có thể chạy ngoại tuyến

Giờ đây, bạn có thể ra lệnh cho các văn bản của mình bằng bàn phím Gboard của Google ngay cả khi không có kết nối internet.

Theo Engadget, nhóm AI của Google vừa thông báo rằng họ đã cập nhật trình nhận dạng giọng nói của Gboard để nó có thể nhận ra từng ký tự một khi họ đang nói và hiện được lưu trữ trực tiếp trên thiết bị. Về cơ bản, việc nhập liệu bằng giọng nói của Gboard sẽ nhanh hơn và đáng tin cậy hơn do không cần phải gửi dữ liệu qua internet.

Google đã giải thích trong một bài đăng trên blog rằng họ muốn tạo một trình nhận dạng giọng nói “đủ nhỏ gọn để cư trú trên điện thoại” và sẽ không bị ảnh hưởng bởi mạng Wi-Fi hoặc mạng di động không đáng tin cậy.

Bản cập nhật mới của Gboard mang đến khả năng nhận diện giọng nói ngoại tuyến. Ảnh chụp màn hình: Engadget.

Truyền thống nhận dạng giọng nói hoạt động bằng cách chia nhỏ các từ bạn nói thành các phần nhỏ hơn được gọi là âm vị. Trình nhận dạng giọng nói sau đó sẽ phân tích thứ tự, mẫu và ngữ cảnh của các âm vị để tạo ra một câu. Điều này thường sẽ dẫn đến độ trễ khi bạn chờ phần mềm đưa ra dự đoán tốt nhất về những gì bạn đang nói. Nhóm AI của Google đã tuyên bố trong bài đăng rằng mô hình của họ xuất ra từng ký tự một (như bạn nói) với khoảng ngắt quãng khi thích hợp. Nói cách khác, Gboard sẽ nhận ra từng chữ cái của những từ bạn nói thay vì nhận ra âm vị.

Hiện tại, bản cập nhật Gboard chỉ có sẵn bằng tiếng Anh và sử dụng trên điện thoại Pixel. Nhóm AI của Google có thể mở rộng bản cập nhật để bao gồm nhiều ngôn ngữ hơn và nhiều thiết bị hơn trong tương lai.

Kiến Văn
Nguồn Thanh Niên