Năm 2017, trong bối cảnh lĩnh vực trí tuệ nhân tạo (AI) ngày càng phát triển mạnh mẽ, Zalo đã "đặt cược lớn" khi đầu tư làm sản phẩm "AI-first" đầy tiềm năng nhưng cũng không kém phần cạnh tranh: Trợ lý giọng nói. Lựa chọn của Zalo được ví gần như "đâm đầu vào đá" khi phải đối đầu cùng những "ông lớn" như Google hay Microsoft…

Làm trợ lý giọng nói tiếng Việt - quyết định táo bạo của Zalo

Chia sẻ trong một buổi phỏng vấn gần nhất với truyền thông, nhà sáng lập Zalo Vương Quang Khải - người được mệnh danh là "chàng Don Quixote" của làng công nghệ Việt Nam, bất ngờ tiết lộ rằng "Zalo từng cách mỏ vàng Crypto chỉ một cái gật đầu", nhưng cuối cùng lại quyết định "đặt cược" vào AI.

"Đó có lẽ là lựa chọn từ trực giác của một kỹ sư với nỗi ám ảnh bị tụt hậu khỏi dòng chảy phát triển công nghệ.", ông Khải nhớ lại.

Hành trình chinh phục thị trường ô tô của trợ lý giọng nói "make in Vietnam"- Ảnh 1.

Ông Vương Quang Khải, nhà sáng lập Zalo

Lựa chọn tập trung vào trợ lý giọng nói, theo ông Khải, còn dựa trên những phân tích sâu sắc về xu hướng phát triển của công nghệ và thế mạnh sẵn có của Zalo.

Vào thời điểm đó, các "big tech" như Google, Facebook, Microsoft, Amazon, Apple cũng đang đầu tư quyết liệt vào AI. Điều này càng làm nhà sáng lập Zalo vững tin vào quyết định lựa chọn lĩnh vực trí tuệ nhân tạo.

Hành trình chinh phục thị trường ô tô của trợ lý giọng nói "make in Vietnam"- Ảnh 2.

Việc tập trung phát triển trợ lý giọng nói tiếng Việt cũng là một quyết định táo bạo nữa của Zalo. Trong khi các ông lớn công nghệ đang cạnh tranh nhau trên thị trường trợ lý ảo toàn cầu, Zalo lại chọn một hướng đi khác biệt: địa phương hóa AI. Kiki được thiết kế đặc biệt để phục vụ người dùng Việt Nam, với khả năng hiểu và đáp ứng các yêu cầu bằng tiếng Việt một cách chính xác và tự nhiên.

Ông Khải cho rằng giọng nói là một phương thức giao tiếp tự nhiên và hiệu quả, đặc biệt là trong bối cảnh người dùng ngày càng bận rộn. "Khi chúng ta sử dụng các thiết bị như điện thoại, tốc độ gõ phím khá chậm, còn nói thì nhanh hơn nhiều. Vì thế, tôi tin rằng giọng nói sẽ là một phương pháp chính để con người trao đổi với máy móc trong tương lai."

Không chỉ vậy, việc phát triển trợ lý giọng nói tiếng Việt sẽ giúp Zalo tận dụng lợi thế từ chức năng gửi tin nhắn thoại đã có từ trước và hiểu biết sâu sắc về thị trường nội địa.

Hành trình chinh phục thị trường ô tô của trợ lý giọng nói "make in Vietnam"- Ảnh 3.

Trợ lý giọng nói "Make in Vietnam" có gì đặc biệt?

Con đường phát triển trợ lý Kiki không hề bằng phẳng. Đội ngũ đã phải đối mặt với nhiều khó khăn, ngay cả trong việc thu hút nhân tài AI do vấp phải sự cạnh tranh khốc liệt từ các "ông lớn" công nghệ. Tương tự OTT, AI cũng là ngành công nghệ world-class (đẳng cấp thế giới). Những người giỏi nhất chỉ có ở Mỹ hay Trung Quốc với các công việc rất tốt không lý do gì bỏ sự nghiệp đầy triển vọng để về Việt Nam. Ngoài khó khăn nhân sự, máy móc phần cứng và dữ liệu cũng là một bài toán Zalo AI cần giải.

Tuy nhiên, bằng tinh thần "ngây thơ không biết sợ", đội ngũ non trẻ thời bấy giờ của Zalo AI đã vượt qua mọi trở ngại. "Chính những kỹ sư trẻ, ngây thơ và đầy nhiệt huyết ấy đã tạo nên xương sống cho đội ngũ của Zalo AI bây giờ," ông Khải khẳng định.

Một trong những bài học quý giá đội ngũ Zalo AI rút ra được từ quá trình phát triển Kiki là tập trung vào những tính năng cốt lõi, đáp ứng nhu cầu thực tế của người dùng.

Trước khi Kiki ra đời, thị trường trợ lý ảo toàn cầu đã có 2 cái tên rất sáng giá là Amazon Alexa và Google Assistant. Cả hai sản phẩm quốc tế này đều có rất nhiều chức năng, khiến đội ngũ bị cuốn vào việc cố nghĩ ra nhiều tính năng vui vẻ tương tự. "Đây là sai lầm," ông Khải nói.

Vị lãnh đạo Zalo và đội ngũ kĩ sư nhận ra thay vì "so kè" phải giỏi hơn Android Auto hay Apple Carplay, đội ngũ cần xác định đúng nhu cầu của người dùng Việt Nam và đáp ứng thật tốt điều đó.

Do đó, Zalo không cố gắng tạo ra một trợ lý đa năng với hàng loạt tính năng hào nhoáng mà tập trung vào 2 chức năng chính: nghe nhạc và dẫn đường. Đây cũng là điểm mạnh của Kiki.

Hành trình chinh phục thị trường ô tô của trợ lý giọng nói "make in Vietnam"- Ảnh 4.

Khi so với các đối thủ cạnh tranh quốc tế, trợ lý giọng nói của Zalo có ưu thế vì có tính địa phương hóa cao, còn khi so với thị trường nội địa, Kiki rất thực dụng và hữu ích đối với người dùng. Nhờ đó, Kiki đã đạt được độ chính xác cao và trở thành trợ lý đắc lực cho tài xế.

Đơn cử như nhờ kinh nghiệm vận hành Zing MP3, đội ngũ Zalo biết người Việt thích nghe những ca khúc nào, ca sĩ nào. "Vì thế dù gọi sai tên của bài hát hay phát âm ‘ngọng’ tên ca sĩ tiếng Anh thì Kiki vẫn hiểu đúng. Tương tự như vậy với bản đồ, khi chúng tôi lên danh sách từng con phố, từng địa điểm phổ biến ở các thành phố lớn khắp Việt Nam", ông Vương Quang Khải chia sẻ.

Kiki - Bạn đồng hành thông minh của gần 1 triệu tài xế Việt

Nhờ định hướng đi vào "ngách hẹp", tận dụng lợi thế có sẵn, Kiki đã trở thành một trong những ứng dụng trợ lý giọng nói phổ biến nhất tại Việt Nam. Theo nhà sáng lập Zalo, ước tính cứ 5 xe ô tô đang chạy trên đường ở Việt Nam sẽ có 1 xe cài Kiki. Đây cũng là ứng dụng chiếm thị phần nhanh nhất trong lịch sử Zalo.

Với gần 1 triệu lượt cài đặt, Kiki không chỉ đơn thuần là một trợ lý giọng nói, mà còn là một người bạn đồng hành thông minh, luôn sẵn sàng hỗ trợ tài xế trên mọi nẻo đường. Liên tục được cập nhật tính năng mới, Kiki giúp người lái xe tập trung vào việc điều khiển xe, đáp ứng đa dạng nhu cầu của người dùng chỉ bằng giọng nói.

Kiki được huấn luyện với một lượng lớn dữ liệu tiếng Việt, giúp trợ lý này hiểu và đáp ứng các yêu cầu của người dùng một cách chính xác, kể cả những câu hỏi phức tạp hoặc những giọng địa phương khác nhau.

Không chỉ được người dùng cá nhân ưa chuộng, Kiki còn được các nhà sản xuất ô tô và phụ kiện tin tưởng lựa chọn. Hiện có hơn 22 đối tác hàng đầu trong lĩnh vực cung cấp linh kiện và phân phối ô tô tại Việt Nam tích hợp Kiki vào sản phẩm của mình. Điều này cho thấy tiềm năng phát triển rất lớn của trợ lý giọng nói này trên thị trường Việt Nam.

Sự thành công của Kiki không chỉ là một câu chuyện về một sản phẩm công nghệ, mà còn là minh chứng cho sự phát triển mạnh mẽ của ngành AI tại Việt Nam. Trong tương lai, người dùng có thể kỳ vọng sẽ thấy Kiki xuất hiện trên nhiều thiết bị thông minh hơn nữa, phục vụ tối đa đời sống của người dùng Việt Nam.

Trợ lý giọng nói tiếng Việt Kiki là một sản phẩm trí tuệ nhân tạo của Zalo, ra mắt từ cuối năm 2020. Ứng dụng các công nghệ tiên tiến hiện nay của thế giới như xử lý ngôn ngữ tự nhiên, biểu đồ tri thức, dữ liệu lớn (big data), Kiki có thể thực hiện được nhiều tác vụ phổ biến trong đời sống, thông qua việc ra lệnh bằng giọng nói.

Khi được tích hợp lên ô tô, trợ lý giọng nói Kiki mang đến trải nghiệm rảnh tay (hand-free), giúp tài xế tập trung và lái xe an toàn hơn. Hiện tại đã có gần 1 triệu ô tô cài đặt trợ lý giọng nói Kiki tại Việt Nam.