發布時間:2024-11-08
看點概覽:
一、清言上線情感語音模型,連AI都懂你
二、會刷視頻的AI來了!視頻理解模型上線
三、圖像生成界也有自己的六邊形戰士
四、訊飛星火發布11項技術及應用,大模型規模化
五、又一軟組織手術機器人獲批上市
一、清言上線情感語音模型,連AI都懂你
(來源:智譜清言)
智譜的大模型家族加入了一位新成員——GLM-4-Voice 端到端情感語音模型。GLM-4-Voice 能夠理解情感,有情緒表達、情感共鳴,可自助調節語速,支持多語言和方言,并且延時更低、可隨時打斷。
GLM-4-Voice 具備以下特點:
● 情感表達和情感共鳴:聲音有不同的情感和細膩的變化,如高興、悲傷、生氣、害怕等。
● 調節語速:在同一輪對話中,可以要求 TA 快點說 or 慢點說。
● 隨時打斷,靈活輸入指令:根據實時的用戶指令,調整語音輸出的內容和風格,支持更靈活的對話互動。
● 多語言、多方言支持:目前 GLM-4-Voice 支持中英文語音以及中國各地方言,尤其擅長粵語、重慶話、北京話等。
● 結合視頻通話,能看也能說:即將上線視頻通話功能,打造真正能看又能說的AI助理。
(來源:智譜清言)
在使用工具方面,還有一個新的進展:AutoGLM。AutoGLM 的 phone use 能力,只需接收簡單的文字/語音指令,它就可以模擬人類操作手機。理論上,AutoGLM 可以完成人類在電子設備上可以做的任何事,它不受限于簡單的任務場景或 API 調用,也不需要用戶手動搭建復雜繁瑣的工作流,操作邏輯與人類類似。
內容詳情:清言上線情感語音模型GLM-4-Voice,AI 的 phone use 也來了
二、會刷視頻的AI來了!視頻理解模型上線
(實時監控,還能自動識別異常情況,比如設備故障、安全隱患等,實現智能巡檢。圖源:階躍星辰)
階躍星辰Step 系列大模型又迎新——視頻理解模型 step-1.5v-turbo,step-1.5v-turbo 基本素質到位,具備出色的視頻理解能力,能夠準確識別視頻中的物體、人物和環境。此外,它還能夠「讀懂空氣」,理解視頻的整體氛圍和人物情緒。最重要的是,它能「聽懂人話」,具備突出的指令跟隨能力,維持穩定的格式化輸出。因此 step-1.5v-turbo 可以廣泛應用于各種視頻分析和處理任務,如視頻 Caption、內容理解、視頻問答等。
內容詳情:會刷視頻的AI來了!視頻理解模型step-1.5v-turbo上線開放平臺
三、圖像生成界也有自己的六邊形戰士
近日,智源推出了新的擴散模型架構 OmniGen,一種新的用于統一圖像生成的多模態模型。OmniGen 天然地支持各種圖像生成任務,例如文生圖、圖像編輯、主題驅動生成和視覺條件生成等。此外,OmniGen可以處理經典的計算機視覺任務,將其轉換為圖像生成任務。
OmniGen 集多項能力于一體,包括但不限于:
● 文本到圖像生成 (Text to Image Generation)
(圖源:智源研究院)
● 指代表達生成 (Referring Expression Generation)
輸入具有單個對象的圖像,理解并遵循指令,輸出基于該對象的新圖像。
(圖源:智源研究院)
● 通用圖像條件生成 (General Image Conditional Generation)
直接輸入原圖,輸入指令“Following the human pose(or depth mapping) of this image, generate a new image:...”,就可根據輸入圖像的人體姿態或深度圖關系生成新圖像。
(圖源:智源研究院)
● 圖像編輯 (Image Edit)
可以在一次運行中同時執行多條編輯指令
(圖源:智源研究院)
● 經典計算機視覺任務:圖像去噪、邊緣檢測、姿態估計等
要求模型刪除圖中能裝水的物品,則模型能夠理解和推斷出指令涉及的圖中物體并刪除。
(圖源:智源研究院)
● 一定的上下文學習能力 (In-context Learning)
輸入一個分割皇后象棋的輸入-輸出配對樣例 (Example),模型能識別并分割新輸入圖像中對應的物體
(圖源:智源研究院)
內容詳情:圖像生成新范式:智源推出全能視覺生成模型 OmniGen
四、訊飛星火發布11項技術及應用,大模型規模化
10月24日,科大訊飛發布訊飛星火4.0 Turbo,以及10項基于訊飛星火底座能力的產品與創新應用:定義多模AIUI標準,發布超擬人數字人;發布星火多語言大模型、訊飛星火醫學影像大模型、汽車端側星火大模型;發布首個基于“問題鏈”的高中數學智能教師系統、星火智慧黑板2.0、AI作業過濾器;發布星火智辦一體機、智能座艙人機交互效果評測機器人VIAS以及科大訊飛多語種AI翻譯透明屏。
(圖源:科大訊飛)
內容詳情:訊飛星火4.0 Turbo發布,首發11項技術及應用,引領大模型規模化落地
五、又一軟組織手術機器人獲批上市
(圖源:MedRobot)
2024年10月28日,瑞士醫療器械公司Distalmotion宣布,其軟組織手術機器人Dexter獲FDA批準上市,用于治療成人腹股溝疝修補手術。
產品構成
● 無菌控制臺
● 模塊化臺車
● 內窺鏡控制臂
● 全腕式一次性儀器
內容詳情:獲批FDA!又一軟組織手術機器人
AI 創新|分享人工智能領域的技術革新和創新應用的新動態,與讀者共同關注AI領域的創新思維與實踐。
AI四連畫
心軟的神未出現,心動的鬼已出現。萬圣節到了,希望老板不要讓我加班,因為我要出去鬼混。
(圖源:即夢AI生成)
并行科技邀您共聚2024AGIC深圳(國際)通用人工智能產業博覽會
領馭科技將亮相AGIC深圳(國際)通用人工智能產業博覽會,“瀚鵬AI”打造企業新質生產力
【IOTE】專注大中功率RFID讀寫器的推廣—上海舜識將亮相IOTE國際物聯網展
【IOTE】RFID智能硬件識別解決方案商—瑞弗艾迪將亮相IOTE國際物聯網展
【IOTE】國內定制化物聯設備與特種電子標簽先驅品牌——鼎界物聯將亮相IOTE國際物聯網展
【IOTE】物聯網應用專家—羅維尼科技將亮相IOTE國際物聯網展
【IOTE】平頭哥邀你相聚2024IOTE國際物聯網展·深圳站
【IOTE】以位置服務為中心的物聯網芯片及解決方案供應商—芯與物將亮相IOTE國際物聯網展