科大訊飛語音技術在導航行業SIP應用方案
2009-11-28 10:09:29
簡述 語音合成(Text To Speech),簡稱TTS技術,它涉及聲學、語言學、數字信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術。解決的主要問題就是如何將文本狀態的文字信息轉化為可聽的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來聽。通俗地說,就是讓機器開口說話的技術。
語音識別(Speech Recognition),簡稱SR技術,語音識別是一門交叉學科,語音識別正逐步成為信息技術中人機接口的關鍵技術,語音識別技術與語音合成技術結合使人們能夠甩掉鍵盤,通過語音命令進行操作。語音技術的應用已經成為一個具有競爭性的新興高技術產業。與機器進行語音交流,讓機器明白你說什麼,這是人們長期以來夢寐以求的事情。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。
如今,車載導航產品已經逐步從早期的車載GPS設備,向集成電子地圖、路徑智能規劃、實時信息服務於一體的綜合化個人信息設備的方向演進。車載導航產品的智能化、人性化已經變為一個重要的發展趨勢,語音與車載導航產品的各種應用和功能相結合,將能很好的提升車載導航系統的可操作性,極大的提高車載導航系統的智能化程度,給車載導航產品帶來更為人性化的表現。
車載導航產品中的語音應用主要是針對車載導航產品屏幕小和經常處於駕駛狀態的特點,將原本需要使用手操作按鍵的使用方法利用最自然最習慣的說話方式代替;把各種傳統上需要同用戶交互的信息(道路信息,駕駛導航信息,POI信息,實時路況等)轉化為語音,使用戶通過語音這種人類自然的交流方式獲取這些信息,從而達到解放用戶的雙手和眼睛、提高駕駛安全性的作用。 設計原則 在與原有車載導航功能相結合,增加語音功能時,盡量保持車載導航產品上原有的用戶界面不變,減少開發工作量。採用附加應用層界面的方式添加語音合成和語音識別功能。
對原有車載導航產品的硬件設計和模具做盡量少的修改要求,盡量不增加硬件成本。 CRM
所有用戶語音應用的內容都可以進行設置,讓用戶選擇是打開還是關閉。 功能描述
本方案分析了車載導航產品中原有的功能與語音合成技術和語音識別技術的各種可能結合點,總結出以下一些語音應用功能點,以圖表方式簡列如下:
附近POI查詢 POI包含的類別比較多,包括:景點,加油站,餐館,住宿,商場,娛樂設施,政府機關,教育文化,金融,醫療等。下面以POI中的加油站和餐館為例介紹: 附近加油站查詢 功能描述:
當用戶需要查詢附近的加油站時,用戶可以在按下識別鍵並聽到識別系統啟動的提醒聲音後,用語音方式給出「附近加油站」命令即可查詢附近加油站。在使用查詢功能得到以距離從小到大排序的查詢結果列表後,可以通過簡單的按鍵選擇列表,光標默認處於距離最近的那個結果上,系統默認會播報出來。當光標移到某個結果上時,系統自動讀出該加油站的名稱和距離等信息,供用戶選擇。當用戶選擇了某個結果,我們可以再次利用語音命令方式將其設為導航的目的地或者途經地。
設計目的:
傳統的POI查詢一般使用多層界面,需要用戶進行多次點擊和選擇操作才可以得到查詢結果列表。而本功能利用語音識別來減少操作步驟,提高操作效率。IPPBX
典型使用場合:
1.駕駛和行程計劃過程:在駕駛車輛前,用戶一般會檢查車內還有多少油,如果剩油不多,用戶此時就需要找到一個最近的加油站去加滿油,此時便需要使用該功能。
2. 駕駛過程中:在駕駛車輛的時候,當用戶發現油量不足,而駕車過程中操作車載導航產品不便,同時也有危險性。通過該功能不用大量複雜的手動操作就能將查詢結果中用戶選擇的加油站設為導航的目的地或者途經地,給用戶帶來安全,快捷的享受。 附近餐館查詢 功能描述:
當用戶需要查詢附近的餐館時,用戶可以在按下識別鍵並聽到識別系統啟動的提醒聲音後,用語音方式給出「附近餐館」命令即可查詢附近餐館。在使用查詢功能得到以距離從小到大排序的查詢結果列表後,可以通過簡單的按鍵選擇列表,光標默認處於距離最近的那個結果上,系統默認會播報出來。當光標移到某個結果上時,系統自動讀出該餐館的名稱和距離等相關信息,供用戶選擇。當用戶選擇了某個結果,我們可以再次利用語音命令方式將其設為導航的目的地或者途經地。
設計目的:
傳統的POI查詢一般使用多層界面,需要用戶進行多次點擊和選擇操作才可以得到查詢結果列表。而本功能利用語音識別來減少操作步驟,提高操作效率。
典型使用場合:
駕駛和行程計劃過程和駕駛過程中。 當前位置 功能描述:
用戶在需要瞭解當前位置時,只需按下識別鍵並在聽到識別系統啟動的提醒聲音後,說出「當前位置」,系統在識別該命令後便可以用語音播報方式讀出當前的位置信息。
設計目的:
當用戶在陌生的城市/地區或者在行駛過程中,往往會有知道當前位置的需求,車載導航產品上GPS定位系統的普及為該功能提供了信息來源。通過語音命令方式而不是傳統的多次點擊和菜單選擇,該功能可以更好的滿足用戶知道當前位置的需求。
典型使用場合:
用戶陌生的城市/地區和駕駛過程中。
應用設計場景說明:
應該添加一個設置項,讓用戶選擇地名播報時是否把地名和經度緯度信息一起播報出來。 目的地快捷設定 功能描述:
當用戶要開始導航過程時,只需按下識別鍵並在聽到識別系統啟動的提醒聲音後,說出「導航到<我的地標>」或「回家」或「回公司」,系統在識別該命令後,便會將對應的地名作為導航的目的地。(<我的地標>表示地標文件夾中所包含的文件的名字,例如「科大訊飛」「市政府」「黃山路」,其中的地標文件用戶可以自由添加,也可以自由命名。)
設計目的:
當用戶需要開始導航時,因為大多數用戶的大多數導航過程總是在少數幾個已知地點之間的,所以可以將那幾個地點標記為地標,通過目的地快捷設定便可以很方便的設置導航目的地,開始導航過程。這樣做可以極大的減少用戶的重複輸入和操作。
典型使用場合:
用戶長期居住的環境中。 保存地標 功能描述:
這個功能是配合「目的地快捷選擇」的一個功能,也就是說首先要使用「保存地標」功能保存過的地標才可以在「目的地快捷選擇」功能中通過「導航到<×××>」指令來將其設為目的地使用。(「×××」表示已保存的地標的名稱)。
1. 當用戶處於無GPS連接的狀態時,用戶可以進入地圖模式,先在地圖上先找到自己可能會頻繁前往的一個地點,然後用光標選中該地點,用戶在按下識別鍵並在聽到識別系統啟動的提醒聲音後,說出「保存地標」,然後該地點就會被保存為一個地標,該地標的名稱可以自定義更改。如果用戶有多個地點需要保存,則重複以上步驟。
2. 當用戶處於GPS正常連接狀態下時,當用戶駕駛到一個他認為他以後可能會經常去的一個地方附近,他想把該地點保存為地標。用戶在按下識別鍵並在聽到識別系統啟動的提醒聲音後,說出「保存地標」,然後該地點就會被保存為一個地標,該地標的名稱可以自定義更改。如果用戶有多個地點需要保存,則重複以上步驟。
設計目的:
該功能可以記憶用戶經常會到的地點,保存其地點信息作為地標,而一旦要將某個已保存的地點作為目的地,便可以使用「目的地快捷選擇」功能將其設為目的地。這樣便達到了減少用戶重複輸入常用地點名稱,減少機器地點搜索次數,節省用戶的精力和時間等目的。
典型使用場合:
普通狀態下和駕駛過程中。
應用設計場景說明:
應該添加一個設置項,讓用戶選擇默認情況下保存的地標的命名規則,例如(1)附近道路(2)附近城鎮。 結束導航 功能描述:
用戶在按下識別鍵並在聽到識別系統啟動的提醒聲音後,說出「結束導航」,系統在識別該命令後,自動結束現有導航。用戶可以再次利用「目的地快捷選擇」等功能再次開始導航。
設計目的:
該功能的設計目的是在駕駛導航過程中,某些情況下目的地發生了改變,此時便需要結束原導航然後開始新導航過程。
典型使用場合:
駕駛過程中。
系統設置
在某些場合下,用戶不方便使用語音播報等功能。因此,系統設置菜單中,需要增加一些針對語音功能的設置選項,讓用戶可以選擇是否打開或者關閉某些不需要的語音功能。
純語音合成菜單設置
車載導航產品語音應用展望 語音識別方面 隨著訊飛嵌入式語音識別技術的不斷發展,將來可以實現更多與導航實際應用結合更為緊密的功能,例如「POI語音模糊查詢」,「交叉路口語音模糊查詢」等。 語音合成方面 隨著車載導航產品與其他通信網絡的互聯互通,以及城市級信息中心的建設,語音技術可以廣泛的應用在實時新聞播報,實時路況播報等功能之中。
没有评论:
发表评论