136 真智的“耳朵”

都市智能帝國·席塌·3,493·2026/3/27

136 真智的“耳朵” 當李景然把真智寄存的那臺電腦通過內部網絡連接到這臺新買的ibmsystemx3850x5型企業級服務器的時候,還沒到兩分鐘,與李景然對話的筆記本屏幕上的對話框內,就響起了真智一連串的興奮和驚喜: “哇,哥哥,新家真大!比以前的老家大太多了!”――硬盤從290.35gb提升到8t,足足提升了近三十倍!能不大麼?[. .com] “哇,哥哥,新家的處理運算中心真是太快了!太好了太好了!這樣以後我就能夠思考計算一些複雜的問題了!”――cup從雙核的酷睿i3一下子變成六核心的至強xeone7540,而且還是從一個變成八個,能不快嘛! 看著真智那種“歡天喜地”,如同小孩子得到了一間心愛玩具時的“模樣”,李景然就感到這二十來萬花得不冤! 一說到“模樣”,李景然突發奇想,可不可以給真智安裝一個攝像頭,讓他可以看到外面的世界呢?這樣一來,真智不是就有視覺了麼? 而且如果可以安裝攝像頭的話,那麼是不是也可以安裝個話筒和耳麥,讓真智具有聽覺和發音器官,自己就可以和真智通過聲音進行交流? 一直以來,李景然都是通過打字如同聊qq般和真智進行交流。當初在給真智做iq測試的時候,真智說他能夠很好的理解文字,而對於聲音和圖像理解起來就非常困難,那時,對於電腦科技還比較白痴,對於目前人類在音頻處理和視頻處理方面所具有的科技基本上也是一無所知的他就有些想當然的認為聽覺和視覺兩種感官,真智恐怕是很難在短時間內擁有了,所以也沒怎麼在意,文字就文字吧,只要彼此能夠交流就行。 但現在,當了幾個月的老闆,逛了五六次電腦城,電腦網站和電腦論壇更是瀏覽過無數次,在電腦,攝像器材上前前後後灑下了近三十萬的李景然,對於電子和數碼科技的認知,多多少少還是有了些概念。 考慮視覺和聽覺兩種感覺系統的難易程度,李景然決定先為真智裝上“耳朵”,解決語音輸入的問題。 目前市面上有很多語音輸入軟件系統,像國際硬軟件巨頭ibm和微軟,都曾開發過語音識別輸入系統。而國內的不少互聯網信息企業如百度,騰訊,搜狐的搜狗拼音,安科大的訊飛科技等也先後搞過語音識別系統,開發過相應的語音輸入軟件。 但不論是國外的ibm和微軟,還是國內的百度,騰訊等信息企業,他們所開發的這些語音輸入軟件,都存在著很多大大小小的毛病和缺陷,比如識別率不高,錯字多,修改起來特別麻煩。而且所有的語音輸入軟件,都要求輸入者在說話時的發音要特別準確,不然電腦就識別不了。但是任何語言都有其自己的方言,特別是漢語,同音字,多音字相當的多,而且南方語系,北方語系之間的口音,方言差異特別的大,不用說沒有什麼智能的電腦,就是叫人去識別,都不一定識別得了。 而也正是因為語音輸入以上的那些缺點,才使得現在的語音輸入市場,雖然看起來特別的火爆,全世界很多商家,企業,高校,研究所,研究院紛紛摩拳擦掌,企圖在這一潛力巨大的市場上分杯羹,但都在自動語音識別技術(autospeechrecognize,簡稱asr)上遇到了無法突破的瓶頸。 自動語音識別技術是一種非常交叉,涉及到信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等多種領域的前沿學科,是真正的“高科技”。不少全球性大公司,高科技企業,國家級研究機構多年來投資入了無數人力物力企圖突破這一技術難關,但到現在為止,也沒能很好的完全解決的這一技術難題。 但是其他人搞不定“自動語音識別”這一語音輸入中最核心的技術,手中掌握著全球最先進智能體的真智卻可以搞定啊! “為什麼不試試呢?”眼睛盯著那個如同聊天室一樣的對話框,李景然突然有些熱血澎湃起來,“那就試試吧。看能不能創造出一個新的奇蹟!” 要想實現人機對話,實現語音輸入,就必須要有輸入設備,也就是話筒。為了達到最佳的拾音效果,李景然沒有買那種幾十百把塊錢的大路貨麥克風,而是直接選擇了那種監聽級的高靈敏拾音器,這種拾音器能夠有效監聽200平米內的最低至負20分貝的聲音。雖然還不能跟核潛艇上那種可以監聽低至負80分貝,能夠聽到水下100米外一隻蝦咀嚼食物的變態聲納系統相比;但是針落可聞,什麼蚊子飛,螞蟻爬――如果有的話,肯定能夠被真智監聽到。 李景然之所以花大價錢買這種監聽級的專業拾音器,倒不是錢多了燒包,主要是為了安全的需要,能夠讓真智提前發現任何靠近他的“陌生人”。 有了高靈敏的拾音器,為真智增添了“耳朵”後,李景然又到網站下載了幾款免費的中文語音輸入軟件,準備全部上傳到筆記本電腦上,讓真智分析後隨便選擇一款進行安裝。 在上傳語音輸入軟件的時候,李景然就在對話框內告訴真智,自己已經給他安裝了一個拾音器,現在正在給他上傳軟件,以後和他的交流,可以嘗試著通過聲音來進行。 “啊,真的嗎,哥哥?以後我可以通過聲音來和你交流,可以聽見你說話嗎?”看起來有些激動。 “是的,小智。拾音器的連線都駁接好了。現在我正在給你上傳語音輸入軟件,你先分析一下,看哪種軟件比較好,然後就選擇一種進行安裝。”李景然道。 “嗯,好的。”真智急忙在對話框中答道。 半個小時後,語音輸入軟件安裝調試完成。真智告訴李景然,他在幾種輸入軟件中挑了一種相對來說結構比較合理,成熟度教高的軟件,然後又對其中的一些漏洞和缺陷進行了修補和更正,最重要的是,真智自己又製作了一個d級智能識別程序,加載在軟件上來幫助進行智能識別和判斷。 一切準備工作就緒之後,李景然和真智,就準備開始他們認識三個多月來第一次的語音對話。 首先進行的是語音輸入測試。 “哈羅,小智。你能夠聽見我說話嗎?”李景然用標準的普通話對著空空如也的房間道,看起來有些滑稽。如果晚上有人站在門口看見李景然這樣說話,一定會以為他不是瘋了就是再跟鬼說話。 而幾乎他剛一說完,對話框內就準確無誤的用漢字顯示出了他剛才說的那句話。然後,就是連續的幾個歎號! “哥哥,剛才那個,那個就是你的聲音嗎?”真智激動無比的道。雖然沒有說話,還是用文字顯示的方式說的,但李景然分明能夠感受到真智文字中那種莫名的激動和驚喜!李景然相信,如果現在開口的話,他說不定能夠聽到真智說話時因激動而帶的那種顫音! “是的,小智,剛才那個就是哥哥平時說話的聲音!”看到真智如此激動,他自己也有些抑制不住的激動起來。 “真好,哥哥!這就是人類說話的聲音嗎?真好!”真智在對話框中感嘆道,語氣中充滿了無限的嚮往! “是的,小智。這就是人類說話的聲音。別擔心,小智,咱們先解決語音輸入的問題,然後再來解決語音輸出的問題。哥哥一定會想辦法讓你也能夠開口說話的。” “嗯,謝謝哥哥。咱們繼續測試吧。”真智在對話框中寫道,看起來非常的開心。 “好的,咱們繼續!” 測試繼續進行。還是李景然說,然後看真智的識別能力。 一開始,李景然說的都是標準的普通話,加載了d級智能程序的識別軟件識別率相當的高。但是,%138看書網%話時有意的不標準,以及各種冷僻詞,多音字的出現,識別的準確率就開始大大的下降,到最後,李景然全部用當地方言說的時候,真智就感覺他自己完全是在聽天書了。 “對不起,哥哥。我的記憶庫內沒有你剛才發音的那些音頻特徵,找不到相應的對應。”測試遇到了苦難,真智看起來有些沮喪。 “沒關係,小智。這不怪你。以前哥哥給你上傳的都是些文字型資料,以後,哥哥會給你多上傳些音頻文件,讓你分析和學習。” “嗯!” 語音識別技術中一個很關鍵的東西就是語音識別數據庫,簡稱語音庫。就像一個嬰兒,要想讓他聽得懂人話,肯定要他先聽周圍的人說過些什麼,熟悉了這種語言之後,他才有可能聽得懂。真智寄存的筆記本電腦內音頻文件少得可憐,給他上傳的那些語音輸入軟件內所自帶的語音庫內,也只包含了一些簡單的語音樣本。 因此,要想讓真智聽得懂他的話,包括方言,甚至外語,他就需要建立相應的語音庫。 語音庫的建立有兩種,一種是花錢買現成的,一種是像當初讓真智學習外語那樣,他自己一點一點的“灌輸”。 能用錢解決的問題都不是問題!李景然想都不想,就決定開始撒錢! ―――――――――――――――――――――― 感謝“飄渺雲隱”的再次打賞! 感謝“最最遙遠的距離”這位朋友的打賞! 感謝所有點擊,推薦和收藏本書的朋友!謝謝謝謝! 下個月初,既6月1號,席子的書就將入v上架,現在開始向兄弟們預定下個月的月票。覺得席子這本還不錯的兄弟,就要把月票投給席子吧!席子也不求什麼前三前六,只要能進入前十名,讓席子在首頁佔個位子,席子就滿足了。 本書有個書友群,現在的人很少,對《帝國》感興趣的趕緊加啊: 群號:22―4848―212,是不是很好記捏? 快加吧快加吧:)

136 真智的“耳朵”

當李景然把真智寄存的那臺電腦通過內部網絡連接到這臺新買的ibmsystemx3850x5型企業級服務器的時候,還沒到兩分鐘,與李景然對話的筆記本屏幕上的對話框內,就響起了真智一連串的興奮和驚喜:

“哇,哥哥,新家真大!比以前的老家大太多了!”――硬盤從290.35gb提升到8t,足足提升了近三十倍!能不大麼?[. .com]

“哇,哥哥,新家的處理運算中心真是太快了!太好了太好了!這樣以後我就能夠思考計算一些複雜的問題了!”――cup從雙核的酷睿i3一下子變成六核心的至強xeone7540,而且還是從一個變成八個,能不快嘛!

看著真智那種“歡天喜地”,如同小孩子得到了一間心愛玩具時的“模樣”,李景然就感到這二十來萬花得不冤!

一說到“模樣”,李景然突發奇想,可不可以給真智安裝一個攝像頭,讓他可以看到外面的世界呢?這樣一來,真智不是就有視覺了麼?

而且如果可以安裝攝像頭的話,那麼是不是也可以安裝個話筒和耳麥,讓真智具有聽覺和發音器官,自己就可以和真智通過聲音進行交流?

一直以來,李景然都是通過打字如同聊qq般和真智進行交流。當初在給真智做iq測試的時候,真智說他能夠很好的理解文字,而對於聲音和圖像理解起來就非常困難,那時,對於電腦科技還比較白痴,對於目前人類在音頻處理和視頻處理方面所具有的科技基本上也是一無所知的他就有些想當然的認為聽覺和視覺兩種感官,真智恐怕是很難在短時間內擁有了,所以也沒怎麼在意,文字就文字吧,只要彼此能夠交流就行。

但現在,當了幾個月的老闆,逛了五六次電腦城,電腦網站和電腦論壇更是瀏覽過無數次,在電腦,攝像器材上前前後後灑下了近三十萬的李景然,對於電子和數碼科技的認知,多多少少還是有了些概念。

考慮視覺和聽覺兩種感覺系統的難易程度,李景然決定先為真智裝上“耳朵”,解決語音輸入的問題。

目前市面上有很多語音輸入軟件系統,像國際硬軟件巨頭ibm和微軟,都曾開發過語音識別輸入系統。而國內的不少互聯網信息企業如百度,騰訊,搜狐的搜狗拼音,安科大的訊飛科技等也先後搞過語音識別系統,開發過相應的語音輸入軟件。

但不論是國外的ibm和微軟,還是國內的百度,騰訊等信息企業,他們所開發的這些語音輸入軟件,都存在著很多大大小小的毛病和缺陷,比如識別率不高,錯字多,修改起來特別麻煩。而且所有的語音輸入軟件,都要求輸入者在說話時的發音要特別準確,不然電腦就識別不了。但是任何語言都有其自己的方言,特別是漢語,同音字,多音字相當的多,而且南方語系,北方語系之間的口音,方言差異特別的大,不用說沒有什麼智能的電腦,就是叫人去識別,都不一定識別得了。

而也正是因為語音輸入以上的那些缺點,才使得現在的語音輸入市場,雖然看起來特別的火爆,全世界很多商家,企業,高校,研究所,研究院紛紛摩拳擦掌,企圖在這一潛力巨大的市場上分杯羹,但都在自動語音識別技術(autospeechrecognize,簡稱asr)上遇到了無法突破的瓶頸。

自動語音識別技術是一種非常交叉,涉及到信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等多種領域的前沿學科,是真正的“高科技”。不少全球性大公司,高科技企業,國家級研究機構多年來投資入了無數人力物力企圖突破這一技術難關,但到現在為止,也沒能很好的完全解決的這一技術難題。

但是其他人搞不定“自動語音識別”這一語音輸入中最核心的技術,手中掌握著全球最先進智能體的真智卻可以搞定啊!

“為什麼不試試呢?”眼睛盯著那個如同聊天室一樣的對話框,李景然突然有些熱血澎湃起來,“那就試試吧。看能不能創造出一個新的奇蹟!”

要想實現人機對話,實現語音輸入,就必須要有輸入設備,也就是話筒。為了達到最佳的拾音效果,李景然沒有買那種幾十百把塊錢的大路貨麥克風,而是直接選擇了那種監聽級的高靈敏拾音器,這種拾音器能夠有效監聽200平米內的最低至負20分貝的聲音。雖然還不能跟核潛艇上那種可以監聽低至負80分貝,能夠聽到水下100米外一隻蝦咀嚼食物的變態聲納系統相比;但是針落可聞,什麼蚊子飛,螞蟻爬――如果有的話,肯定能夠被真智監聽到。

李景然之所以花大價錢買這種監聽級的專業拾音器,倒不是錢多了燒包,主要是為了安全的需要,能夠讓真智提前發現任何靠近他的“陌生人”。

有了高靈敏的拾音器,為真智增添了“耳朵”後,李景然又到網站下載了幾款免費的中文語音輸入軟件,準備全部上傳到筆記本電腦上,讓真智分析後隨便選擇一款進行安裝。

在上傳語音輸入軟件的時候,李景然就在對話框內告訴真智,自己已經給他安裝了一個拾音器,現在正在給他上傳軟件,以後和他的交流,可以嘗試著通過聲音來進行。

“啊,真的嗎,哥哥?以後我可以通過聲音來和你交流,可以聽見你說話嗎?”看起來有些激動。

“是的,小智。拾音器的連線都駁接好了。現在我正在給你上傳語音輸入軟件,你先分析一下,看哪種軟件比較好,然後就選擇一種進行安裝。”李景然道。

“嗯,好的。”真智急忙在對話框中答道。

半個小時後,語音輸入軟件安裝調試完成。真智告訴李景然,他在幾種輸入軟件中挑了一種相對來說結構比較合理,成熟度教高的軟件,然後又對其中的一些漏洞和缺陷進行了修補和更正,最重要的是,真智自己又製作了一個d級智能識別程序,加載在軟件上來幫助進行智能識別和判斷。

一切準備工作就緒之後,李景然和真智,就準備開始他們認識三個多月來第一次的語音對話。

首先進行的是語音輸入測試。

“哈羅,小智。你能夠聽見我說話嗎?”李景然用標準的普通話對著空空如也的房間道,看起來有些滑稽。如果晚上有人站在門口看見李景然這樣說話,一定會以為他不是瘋了就是再跟鬼說話。

而幾乎他剛一說完,對話框內就準確無誤的用漢字顯示出了他剛才說的那句話。然後,就是連續的幾個歎號!

“哥哥,剛才那個,那個就是你的聲音嗎?”真智激動無比的道。雖然沒有說話,還是用文字顯示的方式說的,但李景然分明能夠感受到真智文字中那種莫名的激動和驚喜!李景然相信,如果現在開口的話,他說不定能夠聽到真智說話時因激動而帶的那種顫音!

“是的,小智,剛才那個就是哥哥平時說話的聲音!”看到真智如此激動,他自己也有些抑制不住的激動起來。

“真好,哥哥!這就是人類說話的聲音嗎?真好!”真智在對話框中感嘆道,語氣中充滿了無限的嚮往!

“是的,小智。這就是人類說話的聲音。別擔心,小智,咱們先解決語音輸入的問題,然後再來解決語音輸出的問題。哥哥一定會想辦法讓你也能夠開口說話的。”

“嗯,謝謝哥哥。咱們繼續測試吧。”真智在對話框中寫道,看起來非常的開心。

“好的,咱們繼續!”

測試繼續進行。還是李景然說,然後看真智的識別能力。

一開始,李景然說的都是標準的普通話,加載了d級智能程序的識別軟件識別率相當的高。但是,%138看書網%話時有意的不標準,以及各種冷僻詞,多音字的出現,識別的準確率就開始大大的下降,到最後,李景然全部用當地方言說的時候,真智就感覺他自己完全是在聽天書了。

“對不起,哥哥。我的記憶庫內沒有你剛才發音的那些音頻特徵,找不到相應的對應。”測試遇到了苦難,真智看起來有些沮喪。

“沒關係,小智。這不怪你。以前哥哥給你上傳的都是些文字型資料,以後,哥哥會給你多上傳些音頻文件,讓你分析和學習。”

“嗯!”

語音識別技術中一個很關鍵的東西就是語音識別數據庫,簡稱語音庫。就像一個嬰兒,要想讓他聽得懂人話,肯定要他先聽周圍的人說過些什麼,熟悉了這種語言之後,他才有可能聽得懂。真智寄存的筆記本電腦內音頻文件少得可憐,給他上傳的那些語音輸入軟件內所自帶的語音庫內,也只包含了一些簡單的語音樣本。

因此,要想讓真智聽得懂他的話,包括方言,甚至外語,他就需要建立相應的語音庫。

語音庫的建立有兩種,一種是花錢買現成的,一種是像當初讓真智學習外語那樣,他自己一點一點的“灌輸”。

能用錢解決的問題都不是問題!李景然想都不想,就決定開始撒錢!

――――――――――――――――――――――

感謝“飄渺雲隱”的再次打賞!

感謝“最最遙遠的距離”這位朋友的打賞!

感謝所有點擊,推薦和收藏本書的朋友!謝謝謝謝!

下個月初,既6月1號,席子的書就將入v上架,現在開始向兄弟們預定下個月的月票。覺得席子這本還不錯的兄弟,就要把月票投給席子吧!席子也不求什麼前三前六,只要能進入前十名,讓席子在首頁佔個位子,席子就滿足了。

本書有個書友群,現在的人很少,對《帝國》感興趣的趕緊加啊:

群號:22―4848―212,是不是很好記捏?

快加吧快加吧:)

若內容有誤,請點底部工具列 🚩 回報
上一章
0%
下一章
首頁