Việt ngữ lắt léo, ViVi vẫn theo kịp

Không phải ngẫu nhiên mà dân gian có câu “Phong ba bão táp không bằng ngữ pháp Việt Nam”. Khác với nhiều ngôn ngữ ưu tiên sự rõ ràng và trực tiếp, tiếng Việt nổi bật bởi sự uyển chuyển trong biểu đạt cảm xúc và sắc thái. Một thay đổi nhỏ trong tông giọng hay thứ tự từ cũng có thể làm biến đổi hoàn toàn nghĩa của câu nói.

Dưới góc nhìn máy tính, tiếng Việt cũng không hề dễ hiểu. Chính sự phong phú và đa dạng ngữ nghĩa ấy đã đặt ra thách thức lớn cho các hệ thống xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP).

Trước bài toán ấy, trợ lý ảo ViVi được thiết kế không chỉ để nhận diện câu lệnh, mà còn có khả năng hiểu ngữ cảnh, diễn giải cảm xúc và phản hồi phù hợp, ngay cả khi người dùng không nói ra yêu cầu một cách trực tiếp. ViVi hỗ trợ đa dạng các cách diễn đạt từ chuẩn chỉnh và rõ ràng như “Bật điều hòa mức 26 độ”, “Tăng nhiệt độ lên 2 độ”, cho đến những cụm từ bâng quơ, mang tính cảm thán như “Tôi lạnh”, “Hơi nóng”.

Để làm được những điều đó, ViVi được huấn luyện trên nền tảng 600GB dữ liệu tiếng Việt tinh chỉnh từ kho tàng văn học, địa lý, lịch sử cho đến các hội thoại hằng ngày. Song song với đó, hơn 30.000 giờ dữ liệu giọng nói chất lượng cao được đội ngũ chuyên gia VinBigdata thu thập, xử lý và gán nhãn tỉ mỉ với quy trình giám sát nghiêm ngặt để đảm bảo chất lượng dữ liệu.

Nhờ đó, ViVi không chỉ đạt độ chính xác trên 98% khi nhận diện tiếng Việt trong nhóm từ phổ thông mà còn có thể phân biệt giọng vùng miền, sắc thái biểu cảm, và thói quen giao tiếp đặc trưng của người Việt.

Để có thể “nghe đúng” và “hiểu đúng”, ViVi phải thực sự thấm nhuần ngôn ngữ và văn hóa Việt, điều chỉ có thể làm được khi sản phẩm được phát triển bởi đội ngũ kỹ sư người Việt, trên nền tảng dữ liệu thuần Việt.

Ngay từ những ngày đầu, đội ngũ VinBigdata đã lựa chọn con đường khó: tự chủ nghiên cứu và phát triển công nghệ lõi, thay vì phụ thuộc vào nền tảng nước ngoài. Quyết định này không chỉ đòi hỏi năng lực kỹ thuật vượt trội mà còn cần sự kiên định với một tầm nhìn dài hạn.

Với sứ mệnh “Công nghệ Việt – Vì tương lai Việt”, ViVi được xây dựng để hiểu người Việt, phục vụ người Việt, do chính người Việt phát triển trên cơ sở dữ liệu Việt. ViVi không chỉ đơn thuần là một sản phẩm công nghệ, mà còn là minh chứng cho năng lực làm chủ trí tuệ nhân tạo của người Việt.

“Tech Toast ” là chuỗi câu chuyện công nghệ của VinBigdata, kể lại hành trình phát triển những sản phẩm không chỉ giải quyết bài toán kỹ thuật, mà còn để kết nối công nghệ với đời sống hằng ngày. Lấy cảm hứng từ một lát bánh mì được nướng vừa tới, Tech Toast mang đến những lát cắt được “làm nóng” vừa đủ: đủ thú vị để níu chân, đủ gần gũi để đồng cảm và đủ sâu sắc để truyền cảm hứng.

Cùng theo dõi “Tech Toast ” vào Thứ Tư hàng tuần để khám phá những câu chuyện chân thật phía sau từng sản phẩm công nghệ.

VinBigdata – Đơn vị tiên phong cung cấp các giải pháp trí tuệ nhân tạo (AI) dựa trên nền tảng dữ liệu lớn. Trải nghiệm hệ sinh thái của VinBigdata: