Báo cáo tin tức Công nghệ
23 Tháng Năm, 2023

Meta đã phát triển một AI nói mã nguồn mở có thể nhận dạng hơn 4,000 ngôn ngữ được nói

Tóm lại

Dự án MMS của công ty có thể nhận ra hơn 4,000 ngôn ngữ.

Giống như hầu hết các dự án AI được công bố công khai khác, Meta đang chia sẻ các mô hình và mã của mình để giúp duy trì sự đa dạng của ngôn ngữ.

Thông qua công việc này, họ hy vọng sẽ góp một phần nhỏ vào việc bảo tồn sự đa dạng ngôn ngữ đáng kinh ngạc của thế giới.

Siêu dữ liệu đã tạo một mô hình ngôn ngữ AI là một bước đột phá mới mẻ trên ChatGPT. mã nguồn mở dự án MMS đã được tạo ra để duy trì sự đa dạng ngôn ngữ và khuyến khích nghiên cứu và có thể nhận dạng hơn 4,000 ngôn ngữ nói và tạo văn bản (lời nói) trong hơn 1,100. Công ty có phát hành công khai các mô hình và mã của nó ngày hôm nay để tiếp tục các mục tiêu của nó.

“Chúng tôi đang chia sẻ công khai các sáng tạo và mã của mình để khuyến khích những người khác trong cộng đồng nghiên cứu phát triển dựa trên công việc của chúng tôi,” Meta viết. “Thông qua nỗ lực này, chúng tôi hy vọng sẽ bảo tồn được sự đa dạng về ngôn ngữ trên thế giới.”

Meta đã phát triển AI giọng nói nguồn mở có thể nhận dạng hơn 4,000 ngôn ngữ được nói

Khó khăn trong việc huấn luyện bộ nhận dạng giọng nói và mô hình chuyển văn bản thành giọng nói trên số lượng lớn âm thanh không có nhãn phiên âm là điển hình. Nhãn rất quan trọng đối với học máy, có thể xác định và phân loại dữ liệu một cách chính xác. Tuy nhiên, đối với những ngôn ngữ sẽ biến mất trong những thập kỷ tới, “dữ liệu này đơn giản là không tồn tại”, như Meta giải thích.

Meta đã sử dụng các bản ghi âm của các văn bản tôn giáo để thu thập dữ liệu theo một cách khác thường. Công ty cho biết: “Chúng tôi đã sử dụng bản dịch của các văn bản tôn giáo như Kinh thánh, vốn đã được nghiên cứu rộng rãi cho nghiên cứu dịch ngôn ngữ dựa trên văn bản ở nhiều ngôn ngữ vì chúng được dịch sang nhiều ngôn ngữ khác nhau. Chúng tôi đã trích xuất bản ghi âm của những người đọc các văn bản này bằng các ngôn ngữ khác nhau từ các bản dịch có sẵn công khai.” Các nhà nghiên cứu của Meta đã thêm hơn 4,000 ngôn ngữ vào kiểu mẫu.

Cách tiếp cận này nghe có vẻ giống như một công thức cho một mô hình AI thiên về thế giới quan của Cơ đốc giáo. Tuy nhiên, trước khi bạn chế giễu ý tưởng này, hãy xem xét nó từ quan điểm của Meta: Các nhà nghiên cứu tin rằng đây là trường hợp vì họ sử dụng phân loại theo thời gian CTC của người kết nối (hoặc mô hình theo trình tự hoặc kiểu trình tự) hạn chế hơn nhiều về mặt thuật ngữ. sức mạnh tính toán so với mô hình ngôn ngữ lớn (còn được gọi là các loại trình tự) hoặc các mô hình tuần tự để nhận dạng giọng nói. Meta nói rằng điều này không dẫn đến sự thiên vị nam giới trong các bản ghi âm tôn giáo được hầu hết những người nói là nam giới ghi lại.

Meta đã sử dụng wav2vec 2.0, mô hình "học biểu diễn giọng nói tự giám sát", để huấn luyện wav2vec 2.0 mô hình liên kết điều đó làm cho dữ liệu có thể sử dụng được nhiều hơn. Mô hình giọng nói tự giám sát mà Meta tự giám sát từ dữ liệu chưa được gắn nhãn đã mang lại kết quả tuyệt vời. Meta nhận thấy rằng các mô hình giọng nói đa ngôn ngữ ồ ạt hoạt động tốt so với các mô hình hiện có và bao quát gấp 10 lần số ngôn ngữ, đặc biệt là so với Thì thầm. Meta đạt được một nửa tỷ lệ lỗi từ, trong khi Bài phát biểu đa ngôn ngữ đại chúng bao phủ nhiều ngôn ngữ gấp 11 lần.

Meta nói rằng các mô hình chuyển giọng nói thành văn bản mới của nó không hoàn hảo. Ví dụ: họ có thể dịch sai các từ hoặc cụm từ, điều này có thể dẫn đến hành vi xúc phạm và/hoặc không chính xác, công ty viết. Sự phát triển có trách nhiệm của các công nghệ AI phải được thực hiện thông qua sự hợp tác giữa cộng đồng AI.

Vì Meta đã phát hành MMS cho nghiên cứu nguồn mở, nó hy vọng rằng nó có thể đảo ngược xu hướng sử dụng ngôn ngữ đang biến mất. Trong tầm nhìn này, công nghệ hỗ trợ, TTS và thậm chí cả công nghệ thực tế ảo và thực tế tăng cường có thể cho phép mọi người nói và học bằng ngôn ngữ mẹ đẻ của họ. Nó tuyên bố, "Chúng tôi hình dung một thế giới nơi công nghệ có tác dụng ngược lại, thúc đẩy mọi người duy trì ngôn ngữ của họ vì họ có thể truy cập thông tin và sử dụng công nghệ bằng cách nói bằng ngôn ngữ ưa thích của họ."

  • Mới đây Meta đã công bố kết quả tài chính cho quý đầu tiên của năm 2023. Bất chấp những nỗ lực tái cơ cấu gần đây, công ty đã khiến các nhà đầu tư ngạc nhiên với doanh số bán hàng tăng bất ngờ trong quý đầu tiên. Cổ phiếu đã tăng 12% vào thứ Tư.

Đọc thêm bài viết liên quan:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
Kinh doanh Báo cáo tin tức Công nghệ
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
3 Tháng Năm, 2024
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
thị trường Báo cáo tin tức Công nghệ
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
3 Tháng Năm, 2024
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
thị trường Báo cáo tin tức Công nghệ
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
3 Tháng Năm, 2024
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
Kinh doanh Báo cáo tin tức Công nghệ
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
3 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH