最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

首頁 > 資訊 > 行業(yè)

爆料:亞馬遜全球雇傭數(shù)千人“偷聽”Alexa用戶說話

2019/04/11 09:06      騰訊科技 [No.H100]


  國外媒體報道,基于語音助手的智能音箱在全世界越來越流行,數(shù)千萬消費者使用智能音箱和他們的語音軟件來玩游戲,尋找熱門歌曲或查詢百科常識。但是,更多的消費者不愿意邀請這些設備和他們強大的麥克風到他們的家中,因為他們擔心有人可能在聽。

  很多時候,的確是有人在“偷聽”。

  據(jù)國外媒體報道,亞馬遜公司在世界各地雇傭了數(shù)千名員工,幫助改進Alexa語音助手,為其Echo系列音箱系列提供動力。

  這個龐大的團隊聆聽Echo業(yè)主的家中和辦公室捕捉到的錄音。這些錄音被轉錄、注釋,然后反饋到軟件中,亞馬遜這一團隊的目的,是消除Alexa對人類語言理解的空白,并幫助它更好地響應消費者的語音命令。

  根據(jù)七個參加過上述團隊工作的人士透露,Alexa的語音審聽過程突出了在訓練軟件算法中經(jīng)常被忽視的人類角色。

  在營銷材料中,亞馬遜表示,Alexa“生活在云中,而且總是變得越來越聰明。”但是就像許多軟件工具都是為了從經(jīng)驗中學習而構建一樣,人類也在給語音助手做一些教學工作。

  知情人士稱,該團隊由承包商和亞馬遜的全職員工組成,他們在從波士頓到哥斯達黎加、印度和羅馬尼亞的分支機構工作,他們簽署了保密協(xié)議,被禁止公開談論該項目。

  亞馬遜布加勒斯特分支機構的兩名工作人員表示,他們每天工作9個小時,每個審聽者每班分析多達1000個語音片段。亞馬遜布加勒斯特辦公室占據(jù)了羅馬尼亞首都新興的皮佩拉區(qū)Globalworth大樓的最高三層。在搖搖欲墜的基礎設施中,這座現(xiàn)代化的設施脫穎而出,大樓外部沒有任何亞馬遜標志。

  這項工作基本上是平淡無奇的。波士頓的一名工作人員說,他積累的語音資料包括像“泰勒·斯威夫特”(Taylor Swift)這樣的單一詞語,他會對這些數(shù)據(jù)進行了注釋,以表明搜索者指的是一位音樂藝術家。

  偶爾,審聽者也會聽到Echo用戶寧愿保持隱私的東西:比如說,一個在淋浴時唱著難聽歌曲的女人,或者是一個尖叫著求救的孩子。當團隊需要幫助解析一個混亂的單詞或遇到有趣的錄音時,他們使用內部聊天室來共享文件。

  這些工作人員經(jīng)常會聽到令人沮喪的對話,甚至可能是犯罪過程的聲音。

  其中兩名員工說,他們發(fā)現(xiàn)了一起他們認為是性侵犯的事件。當類似的事情發(fā)生時,他們可能會在內部聊天室里分享這些情況,以此作為緩解工作壓力的一種方式。

  亞馬遜表示,當員工聽到令人不快的事情時,他們已經(jīng)制定了如何進行處理的程序,但兩名駐羅馬尼亞的員工表示,在要求對此類案件進行指導后,他們被告知,亞馬遜不會干預語音背后發(fā)生了什么。

  亞馬遜的一位發(fā)言人在一份電子郵件聲明中表示:“我們認真對待客戶個人信息的安全和隱私。為了改善客戶體驗,我們只對極小的Alexa錄音樣本進行了注釋。例如,這些信息可以幫助我們培訓語音識別和自然語言理解系統(tǒng),這樣Alexa就可以更好地理解您的請求,并確保該服務能夠很好地為每個人工作。

  “我們有嚴格的技術和業(yè)務保障措施,對濫用我們的制度采取零容忍政策。在工作流程中,員工無法直接訪問某位用戶或帳戶的信息。所有信息都是高度保密的,我們使用多因素身份驗證來限制訪問、服務加密和檢查我們的控制環(huán)境,以保護用戶隱私。”

  亞馬遜在其營銷和隱私政策材料中沒有明確表示,人類員工正在收聽Alexa收集的一些對話的錄音。“我們利用你對Alexa的要求來訓練我們的語音識別和自然語言理解系統(tǒng),”該公司在一份常見問題列表中說。

  在Alexa的隱私設置中,該公司為用戶提供了在開發(fā)新功能時禁用其錄音的選項。彭博社查看的一張屏幕截圖顯示,發(fā)送給Alexa審聽人員的錄音沒有提供用戶的全名和地址,但是與某位智能音箱用戶的賬號、用戶的名字和設備的序列號相關聯(lián)。

  今年早些時候,美國媒體《The Intercept》報道稱,亞馬遜旗下子公司RING的員工在該公司門鈴攝像頭拍攝的視頻中手動識別車輛和人員,以期更好地訓練該軟件自己完成這項工作。

  美國密歇根大學(University Of Michigan)教授弗洛里安·朔布(Florian Schaub)研究了智能音箱的隱私問題,他說:“你不一定會想到另一個人在興致濃厚地傾聽你說的話。我認為我們已經(jīng)習慣于這樣的假設,即這些機器只是在做神奇的機器學習。但事實是,仍然需要人類員工處理。”

  他補充說:“這是否涉及隱私問題,取決于亞馬遜和其他公司對他們手工注釋的信息類型有多謹慎,以及他們如何向其他人展示這些信息。”

  2014年Echo智能音箱首次亮相之后,亞馬遜的發(fā)明推動了語音軟件在家庭環(huán)境中的使用。

  不久之后,谷歌公司它推出了自己版本的智能音箱,名為Google Home,隨后蘋果公司也推出了自家的的HomePod。

  在中國市場,也有許多公司開始銷售智能音箱?萍际袌鲅芯抗綜analys的數(shù)據(jù)顯示,去年全球消費者購買了7800萬臺智能音箱。數(shù)以百萬計的人使用語音軟件與智能手機上的語音助手進行交互。

  Alexa軟件設計用于連續(xù)錄制音頻片段,收聽喚醒詞,默認情況下是“Alexa”,但人們可以將其更改為“Echo”或“Computer”。當檢測到喚醒字時,智能音箱頂部的光環(huán)變?yōu)樗{色,表明設備正在記錄并向亞馬遜的網(wǎng)絡服務器發(fā)送命令。

  大多數(shù)現(xiàn)代語音識別系統(tǒng)都依賴于模仿人腦的神經(jīng)網(wǎng)絡。軟件通過在大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和模式,從而一邊工作一邊學習。

  為Echo和其他智能音箱提供動力的算法使用概率模型進行有根據(jù)的猜測。如果有人問Alexa附近有沒有希臘餐館,算法知道用戶可能是在找餐館,而不是教堂或社區(qū)中心。

  但有時Alexa也會弄錯——尤其是在處理新的俚語、地區(qū)口語或英語以外的其他語言時。在法語中,avec sa,“和他在一起”或者“和她在一起”等表達方式可能會把軟件搞糊涂,以為有人在使用Alexa的喚醒詞。

  另外,Hecho在西班牙語中代表事實或行為,有時被誤解為Echo。諸如此類,這就是亞馬遜招募人工助手來彌補算法不足的原因。

  蘋果的Siri也有人工助手,他們負責判斷語音助手對請求的解釋是否與該人所說的一致。根據(jù)蘋果的一份安全白皮書,他們審查的錄音片段沒有個人身份信息,并與一個隨機標識符捆綁存儲六個月。在此之后,數(shù)據(jù)將從其隨機標識信息中去除,但可能會被存儲更長時間,以提高Siri的語音識別能力。

  該公司表示,在谷歌,一些審聽者可以從“谷歌助手”那里獲取一些音頻片段,以幫助培訓和改進產品,但它與任何個人身份信息都沒有關聯(lián),音頻也進行了修改。

  亞馬遜公司最近發(fā)布了一篇招聘布加勒斯特“Alexa數(shù)據(jù)服務公司”(Alexa Data Services)質量保證經(jīng)理的啟事,招聘啟事中描述了人類員工扮演的角色:“Alexa每天傾聽成千上萬的人跟她談論不同的主題和不同的語言,她需要我們的幫助來理解這一切。”招聘廣告繼續(xù)說:“這是你從未見過的大數(shù)據(jù)處理。我們每天都在創(chuàng)造、標記、策劃和分析大量的講話。”

  據(jù)一位熟悉該工作流程的人士透露,亞馬遜對語音數(shù)據(jù)的審查過程始于Alexa隨機抽取一小部分用戶的錄音,并將這些音頻文件發(fā)送給遠方的員工和承包商。

  一些Alexa審聽者的任務是轉錄用戶的命令,將錄音與Alexa的自動轉錄文本進行比較,或者注釋用戶和機器之間的交互。那個人問了什么?Alexa提供了有效的答復了嗎?

  其他人會記下他們聽到的每一句話,包括背景對話——即使是在孩子說話的時候。有時,審聽人會聽到用戶討論諸如姓名或銀行詳細信息之類的私人細節(jié),在這種情況下,他們應該在一個表示“關鍵數(shù)據(jù)”的對話框中打勾。然后轉到下一個音頻文件。

  根據(jù)亞馬遜的網(wǎng)站,除非Echo檢測到喚醒詞或按下按鈕激活,否則音頻不會被存儲。但有時,Alexa似乎開始錄制聲音,沒有任何提示,一個聽不懂的噪音意味著音頻文件已經(jīng)開始錄制。

  無論激活是否錯誤,審聽人都必須對語音內容進行轉錄。一位知情人士說,當Alexa沒有收到喚醒指令或被意外觸發(fā)時,審聽人每天記錄多達100段錄音。

  據(jù)兩位亞馬遜審聽人說,在世界各地的家庭中,Echo智能音箱的用戶經(jīng)常猜測誰可能在聽,“你為美國國安局工作嗎”他們還問:“Alexa,有人在聽我們說話嗎?”(騰訊科技審校/承曦)

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞