第38章 (第1/10頁)
月海妖后提示您:看後求收藏(品書網www.vodtw.tw),接著再看更方便。
安夏心中的電子辭典:“哪裡不會點哪裡。”
程式設計師告訴她:沒戲。
現在不管是軟體還是硬體, 都沒可能實現。
“你說的那種,需要把字拍照,再透過系統識別出來, 要麼需要拍照、掃描, 要麼需要線路發出不時序的脈衝訊號,再配上高靈敏的識別。”
這位工程師為了證明不是他們偷懶,在黑板上寫下了「畫」「書」「晝」的繁體字。
“肉眼都會不小心看錯,系統不可能只像四角號碼辭典那樣對四個點進行定位。必須每一條線都準確無誤, 否則就會出錯。”
安夏認可他的說法, 她點點頭:“那你們說的可以實現,是哪一種?”
首先, 把字典裡的字配著讀音,都輸入儲存器。
其次, 人把自己想聽到的詞輸入程式。
計算機調取輸入的字元,與電腦中儲存的字元進行比對,並調取對應的讀音。
聽起來, 還是有希望的。
除了匹配的問題之外, 另一個最大的問題是語音輸入。
漢字那麼多個, 上哪兒找這麼多人讀。
安夏的想法是去有播音主持相關專業的學校, 把常用字讓學生們各自讀了,到時候湊在一起,資料就夠了。
技術總監張喬生一擺手:“不用這麼麻煩, 可以用psola演算法,進行波形編碼合成。”
“早就有了, 不過最近有了新的進展, 出了一種新的動態規劃法, 對濁音段進行整體處理, 時域基音可以同步疊加……”
張喬生興沖沖地企圖教會安夏。
沒等他說完,安夏點點頭:“總之,就是不用人錄,就能出聲音對吧?”
“對。”
“好,你去做吧。”
請程式設計師不要難為產品經理,我只想知道這個功能能不能實現,不是很在意怎麼實現的。
張喬生說到做到,在沒有跳槽進紫金的時候,他就是做音訊相關的,研究的比別人也深一些。
很快就拿出了程式,做第一次測試,安夏輸入「紫金電腦」。
沒聲音。
安夏調整音量,沒動靜。
“音效卡壞了?”安夏問道。
又過了30秒,音箱裡慢悠悠地吐出一個字「紫」。
又過了十幾秒,又緩緩吐出一個「金」。
且不說那個比siri還要詭異的語氣。
最要緊的問題是,讀完四個字,用了一分多鐘。
安夏:“能不能在調取資料的時候,讓它稍微快一點?一份合同上千個字,等唸完,一天都過去了。兩千字不要超過三十分鐘。”
siri風格的唸書差不多兩千字十二分鐘,安夏放寬到三十分鐘,已經很放寬了。
程式設計師再對匹配邏輯進行調整,跳過先匹配字元,再匹配聲音的過程,直接匹配聲音。
兩千字,從九點上班開始念,唸到下午兩點。
用時比第一版省了一半,然而,離安夏的要求還是很遠。
“現在最大的問題是硬體,算完,再調取音訊,播放,差不多就是這個速度。”
安夏想了想,問道:“如果是固定的片語或是句子呢?”
“提前錄製好,會快很多。”
大多數商業合同是制式合同,會變動的往往是數字。
最多加一兩條特殊約定。
安夏拿公司的制式勞動合同先存進系統,試了一下,只修改了人名、入職時間、收入等等。
從硬碟調取的速度果然快了許多。
就是念到後輸入的那些字和詞時,有一種迷幻的時間被拉長感。