一道本久久,日韩在线精品视频

微軟探索音生圖 AI 模型，實時視覺化會議演講者語音講述的場景

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-15 18:49:40 瀏覽：4303次

導(dǎo)讀：IT之家 10 月 15 日消息，科技媒體 MSPoweruser 昨日（10 月 14 日）發(fā)布博文，報道稱微軟公司獲得了一項新的專利，描述了基于用戶實時輸入的語音來生成圖片。根據(jù)美國商標(biāo)和專利局最新公示的清單，該專利共計 20 頁，微軟于 2023 年 4 月 5 日提交申請，于...

IT之家 10 月 15 日消息，科技媒體 MSPoweruser 昨日（10 月 14 日）發(fā)布博文，報道稱微軟公司獲得了一項新的專利，描述了基于用戶實時輸入的語音來生成圖片。

根據(jù)美國商標(biāo)和專利局最新公示的清單，該專利共計 20 頁，微軟于 2023 年 4 月 5 日提交申請，于 10 月 10 日獲批。

根據(jù)專利描述，該系統(tǒng)可以在會議或講座中實時捕捉音頻，隨后通過語言模型進(jìn)行總結(jié)，并生成相應(yīng)的 AI 圖像。

微軟探索音生圖 AI 模型，實時視覺化會議演講者語音講述的場景

IT之家援引該媒體報道，該工作會分為 3 個步驟：

捕捉音頻：用戶通過麥克風(fēng)發(fā)言，系統(tǒng)實時記錄并轉(zhuǎn)化為文本。

處理文本：分段記錄文本，每段內(nèi)容通過語言模型進(jìn)行總結(jié)。

生成圖像：根據(jù)總結(jié)生成的提示，系統(tǒng)創(chuàng)建 AI 生成的圖像，并在屏幕上實時顯示。

預(yù)計該功能將主要應(yīng)用于 Microsoft Teams。隨著演講者話題的變化，實時生成的圖像也會隨之更新，從而增強(qiáng)視覺溝通的效果。微軟表示，這種圖像的使用有助于澄清概念，特別適合通過視覺輔助學(xué)習(xí)的用戶。

相關(guān)熱詞： 微軟探索音生模型實時視覺會議演講者語音講述

微軟探索音生圖 AI 模型，實時視覺化會議演講者語音講述的場景
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-15 18:49:40 瀏覽：4303次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

微軟探索音生圖 AI 模型，實時視覺化會議演講者語音講述的場景 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-15 18:49:40 瀏覽：4303次