首頁 原創 深1度 24小時 洞見 突發 娛樂 傳媒 IT 電腦 軟件 手機 通信 科教 游戲 科技 網絡 物聯網 智汽車 云計算 大數據 醫療 電商 數碼 金融 教育 交通 物流 消費 AI 區塊鏈
當前位置: 首頁 > AI > 正文

百度發布曦靈-AI手語平臺:可實現ASR語音識別 緩解無障礙窗口短缺困境

2022-03-04 08:54:53 來源:網易科技   

  3 月 3 日消息,百度智能云曦靈正式發布“AI 手語平臺”,可實現分鐘級生成手語合成視頻、手語主播實時直播等能力,為手語服務普及的難題提出了新解法。同時百度智能云曦靈還發布了“AI 手語平臺一體機”,可以通過規?;渴鹂焖俳o障礙窗口,適用于醫院、銀行、車站等多種公共場合,緩解無障礙窗口短缺困境。

  針對線上場景,“AI 手語平臺”具備“視頻手語合成”、“直播手語合成”、“文本轉手語”、“語音轉手語”四大功能,只需幾小時的部署,即可實現普通視頻合成為手語視頻、實時直播中增加手語畫面、文字翻譯為手語、語音實時翻譯為手語等多種效果。AI 手語平臺可搭載在各類 App、網站、小程序中,讓聽障人士也能輕松實現線上社交、娛樂休閑、課程學習等各類需求。

  對于諸如醫院、銀行、機場等線下場景,一體化產品的優勢正在逐漸放大。百度智能云曦靈此次發布的全離線一體機 V3 以及端云結合一體機 P3,搭載了“AI 手語平臺”的核心功能,可實現 ASR 語音識別、語音翻譯、人像渲染等多功能,讓“AI 手語平臺一體機”像手機、電腦一樣可快速、批量的生產,并滲透到生活的各個角落。

  未來通過“AI 手語平臺一體機”即可將普通服務窗口直接轉換為“無障礙窗口”,聽障人士在醫院可輕松實現掛號、看診、繳費、取藥等全系列流程,在車站、機場可獨立完成值機、托運、改簽、中轉,在法院、警局等特殊場景中也可對各類緊急情況進行實時平等的溝通。

  在語音識別清晰度上,百度智能云曦靈-AI 手語平臺通過 SMLTA 語音識別算法模型,實現聲學、語言一體化端到端建模語音識別,在手機端近場語音識別率可達 98% 以上。百度語音技術部總監高亮表示,基于百度自研的深度學習算法,還可針對諸如旅游、醫院、司法等不同領域的詞準率進行針對性訓練,詞準率可達 96%,使得 AI 手語平臺一體機更好地應用于不同場景中。

  其次,在手語翻譯的準確度及精煉度上,百度人工智能技術委員會主席何中軍表示,百度研發了首個基于神經網絡的精煉度可控手語翻譯模型,并聯合手語語言學專家、特殊教育專家以及天津理工大學聾人工學院等制定了自然手語標注規范,建設了大規模自然手語翻譯語料庫,使得模型可以從真實數據中學習手語翻譯知識,比如語序的調整、詞語的映射以及長度控制等,從而生成符合聽障人群習慣的自然手語。

  最后,在手語動作的流暢度上,AI 手語平臺通過“動作融合算法”,基于《國家通用手語詞典》規范精修近 11000 多個手語動作,讓每一個動作的起落之間自然銜接,帶來真人手語般地連貫性表達。再配合 4D 掃描技術訓練,使得 AI 手語數字人表情自然生動,口型生成準確度高達 98.5%。

標簽:
廣告、內容合作請點這里:尋求合作
亚洲国产成人在线_暖暖直播韩国免费完整版视频_卡一卡二卡三乱码厨房_最近中文字幕2018高清在线