DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML基礎 >> XML在語音中的應用(一)
XML在語音中的應用(一)
編輯:XML基礎     

 

隨著XML在工業界被廣泛的采用,在不同的領域不同的行業,各自派生出了一些在一些特定領域適用的XML子集。在這一系列文章中中將要主要介紹的VoiceXML就是其中之一。它和WML的地位非常相似。WML是應用於無線上網中的特種語言,VoiceXML是應用於語音浏覽的特種語言。無線上網(WAP)和語音浏覽是現在網絡發展的兩大熱點,XML在它們身上都找到了用武之地。

整篇文章將比較介紹XML在語音中應用的一些重要環節。除了VoiceXML之外,還會介紹一些XML在語音技術中應用的其他方面。在這一部分中主要是背景知識的介紹。

語音浏覽器,VoiceXML誕生的溫床

電話的出現是為了方便通信。電腦的出現是為了計算。進入“後PC時代之”後,“電腦”同“網絡”這兩個詞越來越靠近。現在,很多買電腦的人得以達目的就是為了上網。網絡成了信息交換共享的一條捷徑,人們紛紛“中彈落馬”。以至於通過電話上網也提上了日程。越是簡單通用的,就越是受到最廣泛普通消費者的青睐。越是受到最廣泛普通消費者的青睐的就越是被工業界大力推崇。

有一點是毫無疑問的,那就是現在的電話比電腦要多。隨便走在一個城市的街道上,您會很輕易地發現公用電話。但我現在還不敢想象在大街上隨處可見的“公用電腦亭”,五角錢三分鐘上網。不光是在城市,電話並不是什麼稀罕玩藝,而要買一台電腦,不少人還是要咬一咬牙。而且,電話比電腦的這種優勢還在不斷擴大。個人移動電話的發展正處於前所未有的高峰時期,相信將來的單人對單機並不是什麼神話。

另外,電話遠比電腦具有親和力。我相信許多人對電腦的操作都具有一定工具心理。不是怕原有的界面被改動後無法還原,就是怕不知道應該在哪裡去修改想要的設置。這對已經是比較友好的視窗界面就是如此了,更不要去說什麼滿屏黑的Unix之類。而電話就不一樣了,只有非常有限的幾個鍵,遇到麻煩把話筒一掛再重新拿起就是了。而且關鍵的是電話聽筒裡說的是“人話”。

所以我們說通過電話訪問網絡是非常有前途的。再加上現在還有一種發展趨勢就是把多種界面訪問形式,比如是語音、圖像和觸覺等,一起結合在電話上成為名副其實的PDA(個人數字助理),我們不得不在這裡再一次對電話的發展前途誇耀一番。人們將可以在任何時間任何地點通過隨手可得的“電話”,通過簡單易懂的操作方法連接到網絡。

語音浏覽是網絡的一種全新浏覽方式

對於一家小有規模的公司來說,擁有一台電話總機並不是一件什麼新鮮事。電話用戶可以通過數字按鍵聯絡到不同的員工。還有一種普遍的電話總機功能是用或通過數字按鍵游離層狀目錄結構來獲取信息。而我們要在這裡探討的語音浏覽和這裡的形式上有相似之處。用戶主要是通過語音來發送自己的信息。我們還可以把服務的對象擴大到提供內容服務的網站上去。使用的聯絡網絡也不一定要是專用電話網,還可以是因特網。

什麼是語音浏覽器

語音浏覽器是以語音輸入為主要輸入渠道,其他形式為輔助輸入渠道,翻譯解釋執行語音標記語言,並能產生語音輸出的設備。

上面這段味如嚼蠟的解釋源於W3C。就像要用一句話把人描述出來一樣,它頗費周折地概述了一些空泛的共性。雙腿直立行走,用上肢勞動的哺乳類動物雲雲。語音浏覽器想要實現的是通過最具有親和力的交流方式,把來自具有最豐富資源的網絡上的信息通過聲音提供給用戶。

明眼人一看便知,設計完成一個語音浏覽器還有語音識別、語音理解和語音合成上的技術壁壘。當用戶要通過語音發出命令時,語音浏覽器要知道用戶在說些什麼?比較簡單的是命令式語音識別。系統要求你只能說“蚊子”或是“蒼蠅”。其他的都認為是非法輸入。復雜的要牽涉到對一段語音的理解。比如說當用戶說“今天星期幾?”或是“今天是一個星期中的第幾天?”時要知道是同一回事。這樣的話,用戶就方便了不少。而這就需要語音理解技術來處理了。語音合成也是必不可少的。當你要把浏覽到的信息傳送給用戶時時通過語音。這可以是一段事先錄好的自然人語音,也可以是通過文字到語音的TTS語音合成系統。可以非常明確的說,上面要用到的技術都是需要大量的技術積累才能實現的,絕不是一日之功。對於絕大多數設計實現語音浏覽器的開發上來說都會很自然的去采用一些在語音方面頗有底蘊的公司所提供的技術產品支持。主要的精力都在集成之上。

語音浏覽器的主要特點是非常鮮明的。在許許多多普通的場合之下,通過近似自然對話的方式來發布命令,通過一種不同於HTML兩維的浏覽方式,時間上線性地收取信息。只是非常有誘惑力的。有很多情況之下,根本就不允許用眼睛來監督,如在開車的時候。用戶只有通過非視覺的方式來控制。

網頁浏覽器提供了在不同葉面之間跳轉的方法,語音浏覽器也可以從一段對話跳轉到另一段。網頁浏覽器提供了添取、發送表單的方法,語音浏覽器頁可以設定用戶的一段語音為一次有目的的輸入。事實上語音浏覽器和HTML葉面浏覽器有非常相似之處。用GRE類比題的方式來表示就是:語音浏覽器:VoiceXML::HTML浏覽器:HTML。

 

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved