【新視點】復(fù)旦大學(xué)團隊研發(fā)AI大模型，助視障者“看見”世界

發(fā)布時間：2024-03-05 發(fā)布來源：中國新聞網(wǎng)

在復(fù)旦大學(xué)自然語言處理實驗室（FudanNLP）師生的努力下，基于多模態(tài)大模型“復(fù)旦·眸思”（MouSi）為視障者量身打造的“聽見世界”APP日前上線，將成為視障人士的生活助手與智能管家。

2023年上半年，復(fù)旦大學(xué)自然語言處理實驗室發(fā)布了開發(fā)MOSS對話式大型語言模型，被稱為中國版的GPT，僅用半年時間多模態(tài)模型“眸思”問世。據(jù)介紹，“眸思”和基于文本的MOSS不同，它能夠理解并識別圖片內(nèi)容，致力于成為視障者的一雙“眸”。

　　基于“眸思”，“聽見世界”APP為視障者日常生活需求量身打造街道行走模式、自由問答模式和尋物模式。在街道行走模式中，“眸思”如一位忠實的向?qū)?。紅綠燈、十字路口、障礙物……它能細致掃描道路情況，提示潛在風(fēng)險，陪伴視障者安全通行“看不見”的漫漫長路。在自由問答模式中，“眸思”則像一位貼心的朋友，走進博物館、藝術(shù)館、公園……捕捉四周景象的每個細節(jié)，用聲音構(gòu)建豐富的生活場景，傳遞每一處日常之美。在尋物模式中，“眸思”將成為一名可靠的管家，被移動過的手杖、最愛口味的牛奶……它可以讓視障人士找尋日常物件變得輕松。

　　自去年9月以來，復(fù)旦大學(xué)自然語言處理實驗室圍繞GPT4-v復(fù)現(xiàn)多模態(tài)大模型，對核心關(guān)鍵點開展研究，希望提升單項任務(wù)的準確率和強化大模型的學(xué)習(xí)。為了更好地感受視障者的難處，團隊成員模擬真實情境，蒙眼探索視障者“黑暗”世界。他們邀請視障人士加入，進一步摸清真實而具體的需求。

據(jù)了解，團隊計劃與NGO組織、智算中心和硬件廠商等開展合作，致力于讓視障者免費使用產(chǎn)品和相關(guān)服務(wù)。預(yù)計今年3月“聽見世界”APP將完成第一輪測試，在中國一、二線城市和地區(qū)同步開啟試點，根據(jù)算力部署情況進行推廣。

圖片來源|東西南北雜志社

(聲明：本號所發(fā)內(nèi)容僅作為信息傳遞之目的，版權(quán)歸創(chuàng)作者所有，如有不妥請及時聯(lián)系刪除，謝謝。）

国产黄色视频免费在线观看_99精品国产99久久久久换脸国产AV一区二区三区_久久一本加勒比波多野结衣_在线播放免费人成毛片试看_日韩毛片