[No.L001]
8月23日消息,據外媒報道,Facebook加入語音計算革命大潮的速度有點兒慢。它還沒有自己的語音助手,智能音箱仍在開發(fā)中,Instagram等諸多應用程序也沒有完全集成音頻通信功能。但從Facebook代碼中發(fā)現的線索以及新的專利申請來看,這一狀況將發(fā)生很大變化。
開發(fā)語音功能可以讓人們在家里或在旅途中使用Facebook的方式更多。據報道,Facebook即將推出的Portal智能音箱是專為方便與遠方家人視頻聊天而設計的,這些家人包括使用智能手機不便的老人和孩子。改進后的轉錄和語音-文本-語音功能可以讓Messenger用戶通過輸入媒介連接起來,并讓他們始終保持在聊天應用上,而不是返回到SMS。
但如果Facebook不盡快行動起來,它的語音項目可能會被競爭對手的喧囂淹沒。所有主要的移動硬件和操作系統(tǒng)制造商現在都有自己的語音助手,如蘋果的Siri、亞馬遜的Alexa、谷歌的Assistant以及三星Bixby,他們都在自家智能音箱上集成了語音助手。
市場研究機構Canalys估計,在2018年第二季度,Google Home的出貨量為540萬部,亞馬遜Echo的出貨量為410萬部。而Strategy Analytics的數據顯示,蘋果HomePod起步緩慢,所占市場份額不到6%,依然落后于阿里巴巴的智能音箱。鑒于Facebook在隱私問題上的糟糕記錄,可能導致潛在客戶轉投競爭對手。
考慮到Facebook在語音計算革命中已經落后,它需要強大的工具來解決真正的問題。下面我們來看看Facebook在語音領域取得的最新發(fā)展,以及它過去的實驗如何為下一次飛躍奠定了基礎。
Aloha
Facebook正在開發(fā)自己的語音識別功能,名為Aloha,它適用于Facebook和Messenger應用,同時也適用于外部硬件,比如其正在開發(fā)的視頻聊天智能音箱。獨立應用程序研究員Jane Manchun Wong挖掘出來的Facebook和Messenger Android應用代碼,首次展示了Aloha用戶界面的原型。
它的標簽為“Aloha語音測試”(Aloha Voice Testing),當用戶在消息線程中說話時,一個水平的藍色條會展開并收縮,以在識別和轉錄文本的同時顯示語音的音量。這段代碼描述了該功能可與外部Wi-Fi或藍牙設備連接。這款軟件有可能同時在Facebook的硬件和軟件上運行,類似于Google Assistant,它可以在手機和Google Home智能音箱上運行。
Facebook拒絕對這段視頻發(fā)表評論,但其發(fā)言人表示:“我們始終在測試些新東西,今天沒有什么要分享的,但我的團隊幾周后會聯(lián)系AR/VR網站發(fā)布有關硬件方面的新聞。”目前還不清楚“硬件新聞”是否會集中在語音和Aloha或Portal上,或者僅僅是與Facebook 9月25日舉行的Oculus Connect 5發(fā)布會有關。
知情人士此前曾表示,多年前,Facebook有意開發(fā)自己的語音識別軟件,專門用于準確記錄朋友之間的交談方式。與我們正式稱呼像亞馬遜Alexa或Google Home這樣的電腦化助手相比,Facebook的語音模式通常更隨意、口語化、快速且充滿俚語。
Jane Manchun Wong還在Facebook的代碼中發(fā)現了Aloha的logo,該代碼以火山圖像為特色,F在可以確認,有人曾在Facebook員工的手機上看到過有類似logo的Facebook Aloha Setup聊天機器人。
如果Facebook能夠解決這個問題,它可以在Messenger和網站的其他地方提供自己的轉錄功能,這樣用戶就可以跨媒介進行交流。它可能會讓你在忙得不可開交或看不清屏幕時,向朋友口授評論或信息。然后,收件人可以閱讀文本,而不必去聽語音信息。該功能還可以用于為Facebook應用程序的語音導航提供動力,從而更好地支持免提功能。
音箱與攝像頭專利
2017年8月份有報道稱,Facebook的視頻聊天智能音箱最初代號是Aloha,后來更名為Portal。這款售價499美元的亞馬遜Echo Show競爭對手最初定于今年5月份在Facebook開發(fā)者大會F8上推出。但彭博社報道稱,由于擔心此舉會加劇劍橋分析公司(Cambridge Analytica)引發(fā)的隱私丑聞,該產品被推遲上市。
一項新的專利申請顯示,Facebook早在2016年12月26日為一種立方體形狀的設備申請專利時,就在考慮打造智能音箱。專利描述了由巴貝克·埃爾米赫(Baback Elmieh)、亞歷山大·賈斯(Alexandre Jais)以及約翰·普羅科什-韋利(John Proksch-Whaley)發(fā)明的“音箱裝置”。同年9月,Facebook收購了埃爾米赫的初創(chuàng)公司Nascent Objects,他現在是Facebook秘密建筑硬件實驗室的技術項目負責人。
這家初創(chuàng)公司始終在打造模塊化硬件,今年早些時候,埃爾米赫在Facebook的幾個模塊化攝像頭項目獲得了專利。Facebook一直在開發(fā)的音箱和攝像頭技術可能會演變成視頻聊天音箱。事實上,Facebook已經探索智能音箱技術很長時間了,而且這些專利的發(fā)明者仍在硬件實驗室研究秘密項目,這強化了Facebook在語音領域有宏偉計劃的觀點。
Instagram語音信息
最后,Instagram也在向語音領域進軍。Jane Manchun Wong從Instagram的Android應用程序代碼中生成的截圖顯示,Facebook顯然在開發(fā)語音短信功能Instagram Direct。這將允許你在Instagram上發(fā)聲,并發(fā)送類似于步話機的音頻片段,或早在2013年添加的Facebook Messenger語音信息功能。
你可以在屏幕底部的信息編排器中看到語音按鈕,代碼解釋說“語音信息,按下并保持記錄”。這款原型機是在Instagram Direct最近推出視頻聊天功能后亮相的,也是通過Jane Manchun Wong的研究發(fā)現的另一個功能。Instagram發(fā)言人拒絕置評,因為尚未公開測試的新功能在代碼中被發(fā)現,他們就沒什么可分享的了。
漫長的探索之路
長期以來,Facebook始終在語音領域徘徊。2015年,Facebook收購了自然語言處理初創(chuàng)企業(yè)Wit.ai。這家公司運行著開發(fā)者平臺,用于構建語音接口。不過后來,Facebook將Wit.ai并入到Messenger平臺團隊中,專注于開發(fā)聊天機器人。
Facebook還在2015年開始測試自動將Messenger語音片段轉錄為文本的功能,這可能是上述Aloha功能的基礎。該公司還透露,其個人助理M可以為用戶完成任務,但它只是在非常有限的用戶基礎上推出,后來被關閉。
2016年,Facebook的Messenger主管大衛(wèi)·馬庫斯(David Marcus)聲稱,語音”并不是我們現在積極開發(fā)的工作”。但他補充道:“在某種程度上,隨著我們在Messenger中開發(fā)越來越多的功能和交互,我們將開始研發(fā)語音交流和接口。”然而,消息人士透露,Facebook的秘密預言技術團隊已經在探索語音機會。Facebook還開始為那些只想播放聲音而不是視頻的用戶測試其實時音頻功能。
到2017年,Facebook為網頁視頻提供了自動字幕,并開發(fā)了語音搜索功能。今年,Facebook開始嘗試將語音片段作為狀態(tài)更新和Stories,供世界各地可能無法用母語打字的用戶使用。但高管們并沒有過多談及語音計劃。
Facebook設計總監(jiān)盧克·伍茲(Luke Woods)曾在2017年表示:“語音搜索非常有前途,有很多令人興奮的事情發(fā)生。我喜歡能和汽車對話,讓它導航到特定的地方。這是許多潛在用例之一。這也是聲音轉錄可以提供幫助的領域之一。”
目前還不清楚Facebook的Aloha到底會變成什么樣子。它可能是Facebook智能音箱和應用的實際操作系統(tǒng)或語音界面及轉錄功能,也可能會成為像M那樣功能更完備的語音助手,但也支持音頻;蛘,它可能成為Facebook通往其他語音生態(tài)系統(tǒng)的橋梁,充當Facebook的Alexa Skill或Google Assistant Action。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...