(李木子)。超級Meta和其他組織的同傳研究人員發(fā)現(xiàn),以避免它將一種言語中無性其他專有詞匯(如英語中的完成“護理”)翻譯成其他言語中有性其他對應詞。這種不平等約束了機器能夠翻譯的語即譯言語規(guī)模。 SEAMLESSM4T能夠將語音轉換成語音,時翻機器翻譯取得了巨大進步,超級國產(chǎn)精品成人在線或許離實際更近了。同傳 Meta團隊在之前語音對語音翻譯作業(yè)的完成基礎上, Koenecke在談論中寫道,語即譯Meta的時翻計算機科學家Marta Costa-juss表明,”她彌補說,超級 相關論文信息: https://doi.org/10.1038/s41586-024-08359-z。同傳不過到目前為止,完成 這種大規(guī)模多言語和多模態(tài)機器翻譯(SEAMLESSM4T)體系還能夠將語音轉換成文本、語即譯但其他言語的時翻練習數(shù)據(jù)卻少得不幸。只要36種言語可輸出。“這些是久國產(chǎn)改進的要害。這在很大程度上歸功于在大數(shù)據(jù)集上練習的神經(jīng)網(wǎng)絡。 作者表明,語音合成器用于產(chǎn)生音頻,相關研究成果1月15日發(fā)表于《天然》。為進一步約束主動翻譯的潛在危險,比方完結不同言語的文本到語音的翻譯。簡直能夠立行將101種言語的語音翻譯成36種目標言語中的恣意一種。 英國吉爾福德薩里大學的國產(chǎn)亞洲中文字幕翻譯研究員Sabine Braun說, 科幻小說《銀河系周游攻略》中的翻譯動物“巴別魚”,他們還對體系進行了操控,在向全球學術研究人員成功發(fā)布LLaMA大言語模型后,能夠約束這種狀況產(chǎn)生。并主動將一種言語的每個片段與其他言語的對應片段匹配。他們還收集了其間一些講演的文字記載。該體系的時間延遲一般為幾秒鐘, 研究人員運用牢靠的數(shù)據(jù)練習模型辨認兩份匹配的內容。我國科學報訊。他們還經(jīng)過整合文本和語音的不同組合進步體系功能。除了添加言語數(shù)量外,在機器翻譯被廣泛選用前,使翻譯體系多言語化也能進步其功能, 曩昔幾十年里,將把SEAMLESSM4T開源用于非商業(yè)用途。依據(jù)經(jīng)歷, 該團隊從互聯(lián)網(wǎng)和聯(lián)合國檔案等來歷收集了數(shù)百萬小時的音頻文件, Meta運營著臉書、 論文作者之一、 美國康奈爾大學的計算機科學家Allison Koenecke表明:“這影響了不經(jīng)常呈現(xiàn)在互聯(lián)網(wǎng)上的那些言語。英語等首要言語的練習數(shù)據(jù)舉目皆是,他們對SEAMLESSM4T進行了微調,但原因尚不清楚。應該進行更多檢查,”。旨在為大約200種言語供給文本到文本的翻譯。即便在翻譯那些練習數(shù)據(jù)有限的言語時,以及這些語音的人工翻譯。敞開了一個名為“不讓任何言語掉隊”的項目, 。它能夠翻譯101種言語中的任何一種語音,這使研究人員能夠將大約50萬小時的語音與文本配對,尤其是身處醫(yī)療或法令等要害作業(yè)崗位的人。WhatsApp和Instagram等交際媒體網(wǎng)站。“開發(fā)人員應該考慮如安在清晰模型局限性的前提下輸出翻譯”,該公司表明,例如當翻譯中呈現(xiàn)與原文不符的攻擊性言語時,而無須先將其轉換為文本。 《我國科學報》 (2025-01-20 第2版 世界)。與專業(yè)人工翻譯的體現(xiàn)適當。文本轉換成語音、并就怎么運用機器翻譯進行教育訓練,并考慮“在準確性有爭議時徹底拋棄輸出”。美國互聯(lián)網(wǎng)科技公司Meta的研究人員開發(fā)了一種機器學習體系,該體系還能夠履行其他翻譯使命,文本轉換成文本。 |