تطبيقات

Meta تطلق نموذج SeamlessM4T AI لترجمة اللغات في الوقت الفعلي


أصدرت شركة Meta Platforms ، الشركة الأم لـ Facebook ، يوم الثلاثاء نموذجًا للذكاء الاصطناعي قادرًا على ترجمة ونسخ الكلام بعشرات اللغات ، وهو حجر بناء محتمل للأدوات التي تتيح التواصل في الوقت الفعلي عبر الانقسامات اللغوية.

قالت الشركة في منشور مدونة أن نموذجها SeamlessM4T يمكن أن يدعم الترجمات بين النص والكلام في ما يقرب من 100 لغة ، بالإضافة إلى الترجمة الكاملة للكلام لـ 35 لغة ، والجمع بين التكنولوجيا التي كانت متوفرة سابقًا فقط في نماذج منفصلة.

قال الرئيس التنفيذي مارك زوكربيرج إنه يتصور مثل هذه الأدوات التي تسهل التفاعلات بين المستخدمين من جميع أنحاء العالم في metaverse ، مجموعة العوالم الافتراضية المترابطة التي يراهن عليها على مستقبل الشركة.

وقالت المدونة إن ميتا تجعل النموذج متاحًا للجمهور للاستخدام غير التجاري.

أصدرت أكبر شركة وسائط اجتماعية في العالم موجة من نماذج الذكاء الاصطناعي المجانية في الغالب هذا العام ، بما في ذلك نموذج لغة كبير يسمى Llama يمثل تحديًا خطيرًا لنماذج الملكية التي تبيعها OpenAI المدعومة من Microsoft و Alphabet’s Google.

يقول زوكربيرج إن النظام البيئي المفتوح للذكاء الاصطناعي يعمل لصالح Meta ، حيث أن الشركة لديها الكثير لتكسبه من خلال التعهيد الجماعي بشكل فعال لإنشاء أدوات مواجهة للمستهلكين لمنصاتها الاجتماعية أكثر من فرض رسوم للوصول إلى النماذج.

ومع ذلك ، تواجه Meta أسئلة قانونية مماثلة مثل بقية الصناعة حول بيانات التدريب التي يتم استيعابها لإنشاء نماذجها.

في يوليو ، رفعت الممثلة الكوميدية سارة سيلفرمان ومؤلفان آخران دعاوى قضائية تتعلق بانتهاك حقوق الطبع والنشر ضد كل من Meta و OpenAI ، متهمة الشركات باستخدام كتبهم كبيانات تدريبية دون إذن.

بالنسبة لنموذج SeamlessM4T ، قال باحثو ميتا في ورقة بحثية إنهم جمعوا بيانات تدريب صوتية من 4 ملايين ساعة من “الصوت الخام الناشئ من مستودع متاح للجمهور لبيانات الويب التي تم الزحف إليها” ، دون تحديد المستودع.

لم يرد متحدث باسم Meta على أسئلة حول مصدر البيانات الصوتية.

جاءت بيانات النص من مجموعات البيانات التي تم إنشاؤها العام الماضي والتي سحبت المحتوى من ويكيبيديا والمواقع المرتبطة بها ، حسبما ذكرت الورقة البحثية.

© طومسون رويترز 2023


قد يتم إنشاء روابط الشركات التابعة تلقائيًا – راجع بيان الأخلاقيات الخاص بنا للحصول على التفاصيل.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *