關(guān)于征集2025年AI+多語(yǔ)種翻譯方向儲(chǔ)備課題的通知
為貫徹落實(shí)《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》《北京市科技賦能文化領(lǐng)域創(chuàng)新發(fā)展行動(dòng)計(jì)劃(2025-2027年)》,加快推動(dòng)我市人工智能賦能多語(yǔ)種翻譯創(chuàng)新發(fā)展,現(xiàn)面向在京創(chuàng)新主體,圍繞AI+多語(yǔ)種翻譯方向,征集2025年儲(chǔ)備課題。
一、征集方向
(一)語(yǔ)音翻譯方向
1.研究?jī)?nèi)容
針對(duì)當(dāng)前基于端到端翻譯的多語(yǔ)種語(yǔ)音翻譯大模型在多語(yǔ)種場(chǎng)景下存在的覆蓋語(yǔ)種有限、翻譯精度不足、實(shí)時(shí)翻譯效率低等問(wèn)題,通過(guò)研發(fā)多語(yǔ)種端到端語(yǔ)音翻譯大模型技術(shù)及應(yīng)用,融合語(yǔ)音到文本的跨模態(tài)端到端翻譯、流式意群切分和信息重組、流式語(yǔ)音合成以及系統(tǒng)級(jí)的自動(dòng)調(diào)度等關(guān)鍵技術(shù),建立基于端到端翻譯的多語(yǔ)種語(yǔ)音翻譯模型及應(yīng)用,打造面向國(guó)際會(huì)議會(huì)展、企業(yè)出海、電視直播、多語(yǔ)種教學(xué)等領(lǐng)域的多語(yǔ)種語(yǔ)音翻譯解決方案,推動(dòng)多語(yǔ)種語(yǔ)音翻譯技術(shù)的實(shí)用化和產(chǎn)業(yè)化,提升我國(guó)在多語(yǔ)種語(yǔ)音處理領(lǐng)域的技術(shù)水平和國(guó)際競(jìng)爭(zhēng)力。
2.考核指標(biāo)
(1)研發(fā)多語(yǔ)種端到端語(yǔ)音翻譯大模型,支持以中文、英語(yǔ)為核心,面向法語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、阿拉伯語(yǔ)等聯(lián)合國(guó)官方語(yǔ)言,以及不少于10個(gè)非通用語(yǔ)種的語(yǔ)音輸入、實(shí)時(shí)翻譯及目標(biāo)語(yǔ)言文本輸出和語(yǔ)音播報(bào),實(shí)現(xiàn)端到端的多語(yǔ)種語(yǔ)音翻譯功能。
(2)在安靜環(huán)境(信噪比≥30dB)下,聚焦近場(chǎng)演講場(chǎng)景,單人演講、上課場(chǎng)景達(dá)到可用,多語(yǔ)種端到端大模型翻譯準(zhǔn)確度不低于4.4分(以下均為5分制),內(nèi)容完整度不低于4.4分,整體MOS評(píng)分不低于4.0分,其中中英方向不低于4.2分;端到端翻譯的多語(yǔ)種語(yǔ)音翻譯系統(tǒng)平均首響時(shí)間≤3s。
(3)構(gòu)建多語(yǔ)種語(yǔ)音翻譯行業(yè)應(yīng)用場(chǎng)景庫(kù)不少于3類,包括但不限于國(guó)際會(huì)議、會(huì)展演講、電視直播等場(chǎng)景,系統(tǒng)應(yīng)具備歷史信息記憶機(jī)制和基于語(yǔ)音的信息檢索增強(qiáng)能力,高效融合術(shù)語(yǔ)庫(kù)和禁用語(yǔ)庫(kù)。
3.項(xiàng)目交付成果
多語(yǔ)種語(yǔ)音翻譯系統(tǒng)解決方案1套,集成多語(yǔ)種端到端語(yǔ)音翻譯大模型、相關(guān)硬件設(shè)備。
(二)文檔翻譯方向
1.需求目標(biāo)
針對(duì)用戶在多格式文檔(如Word、Excel、PPT、PDF、圖片等)翻譯中面臨的格式解析困難、版式還原度低、專業(yè)領(lǐng)域翻譯準(zhǔn)確性不足、高并發(fā)場(chǎng)景下效率低等問(wèn)題,構(gòu)建端到端文檔翻譯大模型。實(shí)現(xiàn)從文檔解析到譯文生成的端到端處理,提升多格式文檔翻譯效率、版式還原度及垂類領(lǐng)域?qū)I(yè)性,滿足跨語(yǔ)種文件、科研文檔、法務(wù)合同、技術(shù)支持等場(chǎng)景的高精度翻譯需求。
2.考核指標(biāo)
(1)研發(fā)基于端到端交互的多語(yǔ)種文檔翻譯大模型
支持以中、英為核心,面向法語(yǔ)、西班牙語(yǔ)、阿拉伯語(yǔ)、俄語(yǔ)等聯(lián)合國(guó)官方語(yǔ)言,以及不少于40種非通用語(yǔ)種的文檔結(jié)構(gòu)解析、實(shí)時(shí)翻譯及目標(biāo)語(yǔ)言的文檔原版式輸出(保留原文檔中段落、插圖位置類版式信息,以及句子級(jí)別的字號(hào)、字體、顏色等版式信息、公式信息等),實(shí)現(xiàn)從原始文檔(如 Word、PDF、圖片等)到終稿譯文的端到端處理,減少中間環(huán)節(jié)損耗。
(2)文檔格式支持
覆蓋Word(doc/docx)、Excel(xls/xlsx)、PPT(ppt/pptx)、PDF(含掃描件)、TXT、圖片(jpg/jpeg/png/bmp)等不少于13種格式。
解析成功率≥98%。
(3)譯文保留原文檔版式信息
段落結(jié)構(gòu)還原度≥99%。
圖片/表格位置還原度≥98%。
公式/特殊符號(hào)還原度≥95%。
字體/字號(hào)/顏色還原度≥96%。
(4)翻譯質(zhì)量與性能(5分制)
翻譯準(zhǔn)確性評(píng)分≥4.4分。
內(nèi)容完整度評(píng)分≥4.4分。
語(yǔ)言流暢度評(píng)分≥4.2分。
(5)術(shù)語(yǔ)庫(kù)干預(yù)效果
指定術(shù)語(yǔ)庫(kù)匹配準(zhǔn)確率≥99%。
專業(yè)術(shù)語(yǔ)翻譯一致性≥98%(覆蓋科技、政治、法律等領(lǐng)域?qū)傩g(shù)語(yǔ))。
(6)單文檔翻譯速度
純文本文檔類≥2頁(yè)/秒。
圖文混合類≥1.5頁(yè)/秒。
圖片類≥1.5張/秒。
(7)穩(wěn)定性
系統(tǒng)連續(xù)穩(wěn)定運(yùn)行≥99.9%。
歷史任務(wù)存儲(chǔ)與檢索響應(yīng)時(shí)間≤2秒。
術(shù)語(yǔ)庫(kù)調(diào)用響應(yīng)時(shí)間≤1秒。
(8)應(yīng)用場(chǎng)景
構(gòu)建多語(yǔ)種文檔翻譯行業(yè)應(yīng)用場(chǎng)景庫(kù)不少于3類,包括但不限于會(huì)議演講稿、科研論文等場(chǎng)景,系統(tǒng)應(yīng)具備歷史信息記憶機(jī)制和基于信息檢索增強(qiáng)能力,高效融合術(shù)語(yǔ)庫(kù)和禁用語(yǔ)庫(kù)。
(三)項(xiàng)目交付成果
多語(yǔ)種文檔翻譯系統(tǒng)解決方案1套,集成基于端到端交互的多語(yǔ)種文檔翻譯大模型。
二、評(píng)審方式
方向一:課題面向本市相關(guān)領(lǐng)域優(yōu)勢(shì)創(chuàng)新主體開(kāi)展征集,征集結(jié)束后將于10個(gè)工作日內(nèi)組織創(chuàng)新主體,面向會(huì)議同傳場(chǎng)景,以現(xiàn)有AI翻譯產(chǎn)品“賽馬”,經(jīng)專家評(píng)估,評(píng)選優(yōu)勝團(tuán)隊(duì)開(kāi)展課題支持,并在“智領(lǐng)未來(lái)”北京人工智能品牌系列活動(dòng)中全面推廣使用。
方向二:課題面向本市相關(guān)領(lǐng)域優(yōu)勢(shì)創(chuàng)新主體開(kāi)展征集,征集結(jié)束后采用專家評(píng)審的形式對(duì)申報(bào)課題開(kāi)展評(píng)審工作。
三、申報(bào)課題、申報(bào)單位及申報(bào)負(fù)責(zé)人要求
(一)申報(bào)課題
申報(bào)課題應(yīng)具有較為明確的技術(shù)路線,具有清晰、可量化的目標(biāo)及考核指標(biāo)。每個(gè)方向擬支持課題1項(xiàng),申請(qǐng)課題實(shí)施周期原則上不超過(guò)1年。
(二)申報(bào)單位
1.申報(bào)單位須為在北京地區(qū)注冊(cè)、具有獨(dú)立法人資格的單位。具有相應(yīng)的科研能力和條件,具備健全的項(xiàng)目(課題)管理、財(cái)務(wù)管理、科研人員管理、科技成果與知識(shí)產(chǎn)權(quán)管理、檔案與保密管理等制度,擁有專業(yè)研究團(tuán)隊(duì)和科研管理團(tuán)隊(duì),運(yùn)行管理規(guī)范。
2.申報(bào)單位需符合《北京市科技計(jì)劃項(xiàng)目(課題)管理辦法》和《北京市科技計(jì)劃管理相關(guān)責(zé)任主體信用管理辦法》要求;近3年內(nèi)在申請(qǐng)各級(jí)各類科研項(xiàng)目(課題)中無(wú)不良信用記錄,無(wú)行政處罰或違法記錄,無(wú)不良科研誠(chéng)信記錄。
3.申報(bào)單位為企業(yè)的,需具備相應(yīng)的資金配套能力,配套經(jīng)費(fèi)與財(cái)政科技經(jīng)費(fèi)比例不低于2:1。
(三)申報(bào)負(fù)責(zé)人
1.申報(bào)負(fù)責(zé)人應(yīng)為申報(bào)單位的正式在職人員,具有良好的職業(yè)道德,無(wú)不良行為記錄。在課題申報(bào)時(shí),負(fù)責(zé)人在課題實(shí)施期內(nèi)在職,具有領(lǐng)導(dǎo)和組織開(kāi)展創(chuàng)新性研究的能力,身體健康并能切實(shí)履行職責(zé),有充足時(shí)間保證課題順利實(shí)施。
2.申報(bào)負(fù)責(zé)人需符合《北京市科技計(jì)劃項(xiàng)目(課題)管理辦法》和《北京市科技計(jì)劃管理相關(guān)責(zé)任主體信用管理辦法》要求。申報(bào)負(fù)責(zé)人作為負(fù)責(zé)人同期承擔(dān)北京市科委、中關(guān)村管委會(huì)課題原則上不超過(guò)1項(xiàng),作為主要參加人員同期參與課題數(shù)(含擔(dān)任負(fù)責(zé)人的課題)原則上不超過(guò)2項(xiàng)。
四、申報(bào)方式
1.采取在線申報(bào)方式,申報(bào)單位通過(guò)法人一證通登錄“北京市科技計(jì)劃綜合管理平臺(tái)-在線服務(wù)系統(tǒng)”(https://mis.kw.beijing.gov.cn/)更新本單位信息后(以自然人賬號(hào)申報(bào)的,需綁定單位后再填報(bào)),點(diǎn)擊“項(xiàng)目申報(bào)”,選擇“北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)關(guān)于征集2025年AI+多語(yǔ)種翻譯方向儲(chǔ)備課題的通知”,點(diǎn)擊申報(bào)方向,完成課題申報(bào)材料填寫(xiě),主要包括:課題實(shí)施方案、項(xiàng)目課題簡(jiǎn)表、負(fù)責(zé)人及申報(bào)單位承諾書(shū)(需簽字蓋章),并上傳申報(bào)課題所需的其他證明性材料?;虻卿洷本┦腥嗣裾T(mén)戶網(wǎng)站“政策兌現(xiàn)”欄目(https://zhengce.beijing.gov.cn)選擇相對(duì)應(yīng)的項(xiàng)目進(jìn)行申報(bào)。
2.申報(bào)系統(tǒng)將于2025年8月4日(星期一)14:30至8月15日(星期五)18:00期間開(kāi)放,截止時(shí)間后系統(tǒng)自動(dòng)關(guān)閉。申報(bào)單位需在系統(tǒng)開(kāi)放期間完成本單位申報(bào)課題審核并統(tǒng)一提交,系統(tǒng)關(guān)閉后將不再受理。
五、咨詢服務(wù)
咨詢電話:廖老師010-88828855
技術(shù)支持電話:010-58858689、010-58858681、010-58858685、010-58858680
咨詢服務(wù)時(shí)間:9:00—11:30,13:30—18:00(工作日)
北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)
2025年8月4日
分享到: