五十路熟女俱乐部,韩国非常大度的电影原声,久久久久久人妻一区二区三区,精品久久久久久综合日本

首頁 優秀范文 計算機工程導論論文

計算機工程導論論文賞析八篇

發布時間:2023-04-01 10:12:59

序言:寫作是分享個人見解和探索未知領域的橋梁,我們為您精選了8篇的計算機工程導論論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發,請盡情閱讀。

計算機工程導論論文

第1篇

關鍵詞:家庭自動化系統計算機軟件工程應用

中圖分類號:TP273.5 文獻標識碼:A 文章編號:1007-9416(2012)03-0000-00

1、引言

隨著計算機以及網絡技術的發展,自動化在各行各業都發揮著重要的作用,而家用電子電器也逐步趨于家庭自動化。特別是在美國以及國際的市場中,家庭自動化系統有著廣闊的前景,而國內也正處在成長期。家庭自動化系統本著以實現家庭住宅中各個設備之間的自動管理為目的,這種系統會在適應的時間對各個設備發出相應的指令,從而完成設備的自動化管理。在一般情況下,這種家庭自動化系統都有著燈光控制、環境控制、家電控制以及保安控制等功能來實現家庭的自動化管理。

2、家庭自動化系統在計算機應用中的可行性分析

在技術上,家庭自動化系統有著不同的傳感器,以及單片機和報警系統以及接入的各種家電設備構成的。而物理設備在大型市場上均可購得,主要是實現不同設備之間按一定結構連接起來。無論是在法律因素還是用戶使用可行性上,經過分析,家庭自動化系統是有合同作為雙方合作的基礎,而系統也是主要面向高階層的消費者使用的。從以上多種角度來看,家庭自動化系統都具有其可行的。

3、家庭自動化系統的需求分析

在家庭自動化系統中有著自身一套工程流程,用戶登錄時進行檢查,同時控制不同用戶的使用權限。還有對用戶信息有著增加、修改以及刪除的管理功能,以及可以設定指定時間內對操作記錄進行包括查看以及刪除和自動清除等在內的管理。對設備的狀態進行查看,以及對設備進行監控,包括對其進行啟動、停止等監控操作。

家庭自動化系統的非功能性需求分析。(1)快速的系統反應。在進行家庭自動化系統的設計中,應采用較為先進的網絡技術手段,同時在應用軟件的選擇時也應盡可能采用先進技術,從而保證系統的快速反應。(2)保證系統具有良好的可維護性和開放性。由于家庭自動化系統在國內處于初期發展階段,在系統設計時要考慮到其發展的趨勢。(3)要絕對的保證系統的安全性。在家庭自動化系統中的設備具有安全性要求,故此須建立一套系統的安全保密措施,防止非法訪問。(4)要考慮到用戶的操作方便,要具有友好的人機界面,最大限度的方便用戶去使用。

對于家庭自動化系統的功能需求分析,初步設想可以包括用戶登錄子系統,燈光控制子系統,環境控制子系統以及保安控制子系統和家電控制子系統。對于保安控制包括門窗監控以及視頻監控來實現。環境監測主要是對室內外溫度以及濕度的監控以及調節。

4、家庭自動化系統的總體設計分析

在對家庭自動化系統的總體設計時,主要是進行處理流程設計,總體結構和模塊外部設計,數據結構和接口設計,運行以及出錯處理設計內容。特別是對數據結構的設計,在系統中采用數據庫的三級模式結構,三級模式是指外模式以及模式和內模式三級構成。數據庫的三級模式對應的是數據的三個抽象級別。同時為了能夠在內部實現這三個抽象層次間的聯系以及轉換,在數據庫系統的三級模式間提供了兩層映像。當然,在數據庫設計時需要考慮的原則有,命名的格式規范,索引的使用以及數據的一致性和完整性。其次,對主要表結構的設計時應做到一下幾個方面:關系的映射可能有多種情況,但一般情況下是一個表,而對于條件關系的映射,一個表至少應有三個屬性。減少表之間的冗余字段以及對映射后的表進行冗余控制調整也是必要的。

另外,對于運行設計時,一般有三方面的內容:包括系統用戶或者是一般用戶通過登錄程序登錄到家庭自動化系統中,其次,用戶可通過菜單選擇要執行的相關操作。用戶從子系統傳送過來的請求,通過服務器端控制程序進行解析,并最終將處理結果返回給主系統。當系統在運行或者執行過程中出現異常情況時,系統這時候要有能力自動檢測到并進行相應的處理或者形成有關的報告返回給用戶進行相關恢復處理操作。當然,在家庭自動化系統中也有相關的出錯處理對策,如聯機事務處理,數據庫處理事務失敗自動回滾技術以及重要數據的校驗檢查等。

5、結語

隨著國內房屋的商品化以及人民生活水平日益提高,信息化的產業也逐步滲入到各行各業之中,而人民也多希望家庭更加舒適以及安全和簡便。然而,家庭自動化系統就是利用了計算機技術以及各種先進的網絡技術,將家庭內的各種設備以及家電有機的結合在一起,通過自動化管理,從而達到人民所希望的家具生活。文中只是對家庭自動化系統的產品簡單闡述,還有像系統中的詳細設計以及系統的測試方案等等都未進行闡述,這也需要更多學者共同來研究完成,使家庭自動化系統更加優化。當然,家庭自動化系統由于國內市場廣闊,如果本系統在安全系統以及故障處理系統更加優化以及能提供更完善和更人性化的措施,當本系統投入市場也將風靡國內市場。

參考文獻

[1]李偉強等.家庭自動化系統[J].計算機工程,2007.

[2]李云洪.《家庭自動化系統的研究與實現》[A].同濟大學工程碩士學位論文,2006.

[3]張海藩.《軟件工程導論》[M].北京:清華大學出版社,2008.

第2篇

(1.東南大學成賢學院 計算機工程系, 江蘇 南京 210088;2.南京大學 信息管理學院,江蘇 南京 210093)

摘 要:為了在程序設計課程中有效地培養學生的應用及工程能力,提出基于CDIO理念的教改思路,以C#程序設計課程為載體,建立理實合一、階梯式學—做—學的迭代教學模式并構建多元化的綜合考評體系。

關鍵詞 : CDIO;C#程序設計;教學改革

基金項目:2014年江蘇高校哲學社會科學研究基金指導項目“工程思維導向的獨立學院軟件工程課程群實踐教學模式探索”(2014SJD038);2014年東南大學成賢學院教學研究與改革項目“基于CDIO理念的《C#程序設計》教學模式探索與實踐”(院教學[2014]08號)。

第一作者簡介:謝修娟,女,講師,研究方向為軟件工程,xiujuan__xie@126.com。

0 引 言

“中國擁有世界上最大規模的工程教育體系和最大的工程人才需求市場,也擁有非常豐富的工科生源,這是中國工程教育的優勢”[1] 。然而,理論與實踐脫節是我國高等工程教育中普遍存在和亟待解決的一個瓶頸問題,進行工程教育模式的理論研究和實踐探索具有重要意義。

CDIO(conceive—design—implement—operate)工程教育模式是由美國麻省理工學院、瑞典皇家工學院等4所大學歷時4年探索研究建立的現代工程教育模式,其核心理念是圍繞生產周期中工程產品的構思、設計、實現、運行等各個階段,以過程為載體,培養學生的工程思維能力、個人能力、團隊協作能力以及工程系統能力[2] 。

自2005年起,我國已陸續有50多所院校開始學習、研討和實踐基于CDIO理論的工程教育模式,取得明顯的效果;既重視技能的培養,又關注職業素質提高,尤其注重學生項目開發、設計及建造能力、創新能力、團隊協作與領導能力的培養。目前,計算機程序設計類課程教學依然存在以下問題:①理論與實踐脫節,實踐課時不到總課時的1/4乃至更少,沒有安排應用型實踐;②實驗實踐與應用實踐脫節,實驗多以驗證性為主,缺少探索性,脫離實際應用,每個實驗基本是針對不同知識點孤立進行,缺乏關聯性、真實性、綜合性和實戰性;③教師引導與學生主動學習脫節,以“教”為主,以“學”為輔,“教”是“滿堂灌”“填鴨式”“唯教材”, “學”是“督促式”“壓迫式”,學生缺乏自主學習的原動力、激勵措施和自由空間;④知識教育與素質教育脫節,學校只注重或只滿足于完成知識教育,把對學生的評估重心放在理論知識考核上,忽視對學生溝通能力、團隊合作能力、創新能力等綜合技能的考核[3-4] 。

1 基于CDIO理念的C#程序設計課程教學改革思路

C#程序設計是計算機專業的一門程序設計基礎課,集知識與技能為一體,有很強的實踐性和應用性。課程既要求學生掌握程序設計語言的理論知識,又要求學生具備實際應用能力和操作技能。借鑒CDIO理論在背景、課程開發、設計經驗及工作環境、教學/學習的新方法、教師發展、評估/評價6方面提出的12條標準[5],尤其是第3條、第7條、第8條和第11條,我們將C#程序設計課程教學改革思路與其進行匹配。

1)標準3:一體化課程設置。

一體化課程強調不同課程之間的關聯性。C#程序設計是專業學科中的橋梁課程,該課程的教學設計需要與先修課程及后繼課程有機地聯系起來,變各門課程間的“松耦合”為“強耦合”,保證專業知識鏈的連貫性。例如,東南大學成賢學院計算機工程系的教學計劃就為C#程序設計課程及關聯課程建立自頂向下的以軟件開發為主線的3層課程群結構:第1層是基礎課程(計算機導論、C++、數據結構),是當前課程的先修課程,使學生具備基礎的結構化編程及算法設計能力;第2層為專業主干課程(C#程序設計、軟件工程、數據庫原理及應用),包括當前課程及平行課程,目標是培養學生面向對象的高級編程能力、數據庫設計能力及系統工程化思想;第3層為專業方向課程(項目管理、軟件體系結構、WebService),是當前課程的后繼課程,培養學生系統地利用現代項目管理知識進行項目開發、系統架構、網站開發等技能。

2)標準7和8:綜合性學習經驗、主動學習。

綜合性學習經驗不僅是學科知識的學習,還應包括個人能力、人際能力、軟件產品的構造能力等。教師應通過改進教學方式,激發學生主動學習的積極性。第一,嘗試多元化教育,哈佛大學教授加德納提出“多元智能理論”[6]:每個學生個體的智能分布不盡相同,教師應善于發現并挖掘每個學生的強項,針對他的興趣、特長在掌握課程基礎內容的前提下安排個性化的作業和實踐環節,合理地分配角色,實現因材施教;第二,教學過程中堅持以學生為主體,以教師導、評為主,教師將學習目標告知學生,給學生留有足夠的學、思、練時間;第三,倡導啟發式、項目驅動式教學,教會學生獲得知識的途徑和方法;第四,重視非智力因素的作用,幫助學生樹立正確的人生價值觀,與學生建立良好的師生情感,正面促進學生智力水平的發揮,提高教學質量。

3)標準11:學生考核。

改變傳統只圍繞一本教材知識的一張試卷定成績的做法,采用綜合測評方式評價學習成果。綜合評價體系包括基礎知識測評、技能測評、應用能力測評、創新創造能力測評、職業能力測評等方面。知識測評著重基礎和思維,不出難題、怪題、偏題、邊角題,宜多采用開卷考試,允許學生查書或參考資料,不規定標準答案,允許學生正常理解和發揮。知識考試成績比例不超過30%;技能、應用、創新、職業能力測評成績比例應占50%以上,以任務完成情況和實驗報告為考核形式。

2 C#程序設計課程教學改革方案(試驗版)

鑒于目前諸多高校程序設計課程教學存在理論與實踐脫節、實驗實踐與應用實踐脫節等問題,教師可將理論知識融入實踐中,實現“基于項目的學習”“學中做、做中學”。按照先基礎操作能力、后工程能力,再團隊交際能力培養的思路,C#程序設計課程的教學分為基礎能力培養、綜合型系統能力訓練和開放型項目拓展3個階段,環環相扣,遞推式前進,前一階段是后一階段的基礎,整個過程是一個“學—做—學—做—學......”循環往復的過程,最后通過科學、多元的綜合考評體系,對學生每一階段的學習情況進行考核。

1)基礎能力培養。

該階段主要訓練代碼編輯、程序調試、開發工具使用等基本操作能力,采用任務驅動式機房教學,將理論授課與傳統的驗證型實驗融為一體,講練交替,每次課堂教學按照“提出任務要求—介紹相關知識點—使用知識點解決問題—舉一反三”的方式進行。C#程序設計課程的知識點及對應任務案例的初步設計見表1。

任務是學生能夠直觀感受到的一個開發“情景”。教師通過任務要求引出當堂課程的知識點,講解這些理論知識并演示如何運用知識點實現任務。最后的“舉一反三”環節是緊扣當前知識點設計的簡單驗證型實驗,讓學生運用前面的方法完成類似的任務,是一次知識的鞏固過程。任務驅動式教學方式強調學生的主體地位,更能激發學生的學習興趣和熱情。

2)綜合型系統能力訓練。

階段二是階段一的一次提升,對本課程的所有知識點分模塊內聚,每個模塊選用一個具有一定實用意義的小型開發項目,將知識點融入到項目的各個任務/子任務中,同時有機結合課程群里關聯課程的內容。教師指導學生按照軟件工程生命周期的思想開展項目。每個項目按C—D—I—O分4步進行,以綜合項目“基于控制臺的單詞競猜游戲”為例(涵蓋表1中K1—K18知識點),第1步(構思)通過試玩類似游戲、頭腦風暴等方式,構思本游戲的功能并編寫需求說明書;第2步(設計)要求學生作出游戲的總體及詳細設計方案,包括游戲界面說明,實體類、業務類、數據訪問類的設計等,并編寫設計說明書;第3步(實現)按照設計說明書的要求編寫代碼;第4步(運行)對實現好的游戲進行測試,及時改正測試過程中的錯誤,同時鼓勵學生對游戲再添加一些個性化的創新設計,即完善游戲,最后完成程序部署。

3)開放型項目拓展。

本階段是教學環節的又一次升華,集C#知識應用、工程思維能力、團隊協作能力、個人職業技能于一體。該階段按照“組建團隊—選題—分工合作—項目驗收”的過程進行,由學生自行組建團隊,一般4~6人為一組,教師外部協調,注意好差生的平衡、男女生搭配等。開放型項目的題目應由教師精心挑選,或者由學生提供題目并經過教師審核,保證題目具有一定的科學性和可行性;選好題目后開始角色分工,每組確定一名組長充當項目經理,其他組員根據興趣和特長分配相應角色。項目實施過程中,教師可借助分數甚至虛擬貨幣形式,激發所有組員的集體榮譽感,充分調動組員的最大潛能,以出色地完成各自的分工任務;最后是項目的驗收,每組需提交實驗報告、系統需求及設計說明書、軟件系統,實驗報告的內容至少包括實驗目的、實驗原理及思路、實驗過程介紹、系統運行截圖、實驗結果分析、團隊分工說明6方面。受課時限制,本階段任務大部分在課下進行,預留2節課上時間組織“開放型項目答辯匯報會”。匯報會由教師主持,以組為單位依次進行答辯匯報,通過該環節促進各小組之間分享成果和心得體會,同時鍛煉學生的口頭表達能力和報告能力。

4)建立科學、多元的考核評價體系。

另外,教師還需結合CDIO評價標準,建立多樣化的考核形式,對學生進行多方位的綜合客觀評價,采用過程式評價與結果式評價相結合的方式,既關注學習效果,又關注學習過程。新考評體系從學生的專業知識、個人自身能力、團隊協作能力、系統工程4方面,通過平時作業、上課情況、實驗及實踐項目、期末筆試4種形式進行綜合評價。

平時作業的考核占10%,具體考核內容為理論知識作業以及程序設計作業。理論知識作業要求清晰工整、獨立完成,程序設計作業要求能得到正確運行結果、代碼規范;上課情況的考核占10%,具體考核內容為出勤率、課堂表現和專題知識演講,出勤方面要求沒有無故缺課,課堂表現要求認真聽課并積極發言、學習主動性高、對于專題知識演講積極參與、準備充分、表述清楚;實驗及實踐項目的考核占50%,具體考核內容為驗證型實驗、綜合性開發項目和開發型項目,驗證型實驗要求程序正確符合要求、實驗報告文檔規范,綜合性開發項目要求過程規范、各階段文檔齊全且正確、程序正確符合要求,開發型項目要求成員職責分工明確、成員間溝通良好、有團隊意識、集體榮譽感強、自主鉆研克服難題、具備一定的工程思維、具有創新思想;期末筆試的考核占30%,主要考查C#基礎知識,要求掌握基礎的程序設計知識、會分析程序、在規定時間內編寫程序。

3 結 語

東南大學成賢學院對2012級計算機系本科生的C#程序設計課程進行CDIO教學改革試點,用新的考評體系測評學生的學習成績,與以往學生相比有以下提高:第一,學生的學習主動性明顯提高,課堂氣氛更為活躍,學生參與度高;第二,學生的程序設計能力增強,90%的學生能獨立完成課程實驗,還涌現出一批優秀學生參與各種程序設計大賽并取得優異成績;第三,創新能力、團隊意識有所提高,學生學有所思,能提出一些新想法,課余自組團隊,積極申報創新項目,2012級學生創新項目立項數創歷史新高。總體來說,新教學模式更有助于應用型人才的培養,與企業對軟件開發人才的需求相適應。

參考文獻:

[1] 中國教育報. 2011北京工程教育區域性國際會議召開[EB/OL]./paper.jyb.cn/zgjyb/html/2011-05/12/content_46334.htm.

[2] 王洪發, 于峰. 基于CDIO理念的WEB程序設計教學改革探索[C]//第三屆教學管理與課程建設學術會議論文集. 株洲: 湖南工業大學出版社, 2012: 35-38.

[3] 姜大志, 孫浩軍. 基于CDIO的主動式項目驅動學習方法研究: 以Java類課程教學改革為例[J]. 高等工程教育研究, 2012(4): 159-164.

[4] 曹瑩瑩, 朱立才, 蔡長安. 基于CDIO的程序設計類課程案例的設計與實施[J]. 計算機教育, 2011(6): 56-58.

[5] Worldwide CDIO Initiative Standards[EB/OL]./cdio.org/implementing- cdio-your-institution/standards.

第3篇

武強,邊巴旺堆

(大學 工學院, 拉薩 850000)

摘要:在當今信息社會,信息檢索已經成為人們日常工作的一部分。藏文作為一種古老的文字,也融入了當今的信息時代,越來越多的網頁、電子郵件等電子文檔以藏文形式出現。該文主要探討了藏文的構成、編碼、分詞及藏文相關提示詞的實現原理及方法,對具有重要影響的藏文分詞和排序進行了深入的分析,實現了在信息檢索系統中基于權重的藏文自動提示功能。通過測試分析,該功能能較好地分辨藏文和依據權重對藏文進行相關詞提示。

關鍵詞:藏文;分詞;信息檢索;相關詞提示;編碼;網頁

中圖分類號:H214 文獻標識碼:A 文章編號:1009-3044(2014)19-4378-03

Research and Implement of Tibetan Term Suggestion in Information Retrieval System

WU Qiang, BianBa Wangdui

(College of Engineering, Tibet University, Lhasa 850000, China)

Abstract: Information retrieval has become a part of people work in today’s information society. As one ancient language, Tibetan has blended in with today’s information age. There are more and more web pages, e-mails etc. in the form of Tibetan. The paper mainly discusses the structure, encoding, term segmentation of Tibetan and implementation mechanism and method of Tibetan term suggestion, and analyses deeply the Tibetan word segmentation and Tibetan sort, finally implements the function of Tibetan term suggestion based on the value of a Tibetan word in documents. From testing, the function can distinguish Tibetan word and get the Tibetan term suggestion based on value properly.

Key words: Tibetan; word segmentation; term suggestion; information retrieval; encoding; Web page

1 概述

目前,隨著互聯網和個人電腦的發展,信息量每天都以指數級增長,信息檢索[1]成了一種人們獲取日常信息的主要手段。藏文,作為一種古老的書寫文字,其歷史可以追溯到1400多年前。迄今為止,以藏文記載的古典著作浩如煙海,這些書籍在藏民族的傳承和發展上發揮著重要的作用。隨著信息時代的到來,以藏文形式記載的各種網頁、文檔也越來越多,利用檢索系統對藏文進行檢索,可以更快地獲取信息,同時也促進了藏文的發展。

相關詞的自動提示功能(Term Suggestion)在一些常用的網站上可以看到,比如搜索網站谷歌,百度,電子商務網站淘寶,易趣等。相關詞的自動提示功能優化了搜索結果,通過系統來猜測檢索人需要的搜索詞語,為檢索人在信息檢索時提供了更多的便利和較準確的檢索結果。圖1顯示了百度搜索引擎上相關詞的提示功能。從該圖我們可以看到,相關詞的提示功能即提高了檢索書寫速度,又延長了檢索詞的長度,為進一步返回更準確的結果提供條件。

圖1 百度上漢語自動提示功能

2 藏文的構成、編碼及分詞

2.1藏文的構成

藏文字是一種拼音文字,可以被看做由基本字符且基本字符通過縱向疊加和橫向連接而成[2][3]。藏文字主要由現代藏文和一些梵音轉寫體和反寫體組成。現代藏文是由三十個輔音字母和四個元音字母組成,它是藏文字的主要組成部分。加上梵音的轉寫體和反轉體,藏文共有四十一個輔音字母和十三個元音字母。圖2給出了一個藏文字的各組成構件,藏文字看起來雖然復雜,但每一個藏文字并不是隨意構成的,它有一套嚴格的構字規則和文法體系,違犯了構字體系,該字就不能被視為藏文,既不能拼讀,也不會有實際意義。

圖2 藏文字的組成構件

2.2 藏文編碼

由于藏文信息處理技術的起步較晚,在發展的前期還沒有形成統一的編碼,各個公司在開發藏文軟件時都使用自己開發的編碼系統[4],這必然導致各個藏文軟件的不兼容,容易形成亂碼。1997年,國際標準化組織通過了藏文國際編碼標準,藏文有了一個統一的編碼標準體系。信息檢索系統在對檢索詞進行檢索之前,首先要從互聯網或本地磁盤系統抓取要被檢索的網頁或文檔,然后對文檔進行分析和建立索引,最后文檔才被檢索。在這個過程中,識別被檢索的網頁或文檔的編碼是一項非常重要的工作,只有識別正確,返回的檢索結果才不會形成亂碼。在本系統的開發測試期間,我們的網頁和文檔主要采用藏文的國際編碼標準,即Unicode編碼。當然,我們也可以對具有不同編碼的藏文網頁或文檔進行統一編碼,然后再進行文檔的分析及索引,這個過程主要涉及到藏文的編碼及轉換[5],從文獻[5]可以看出,通過合適的途徑,我們可以把目前不同的藏文編碼統一為國際編碼。

2.3 藏文分詞

藏文詞語之間是用分隔符來劃分的,類似英文中的空格,橫向上又和中文有一定的相似,藏文分詞是進行藏文信息處理的一項基本工作,文獻[6]提出了基于格助詞和接續特征的藏文自動分詞方案,該方案參考藏文詞語的特點和漢語在分詞方面已經做出的一些成績。在本系統的設計中,藏文分詞主要考慮在以下幾個方面:

1) 藏文檢索詞本身應具有實際意義

在信息檢索系統中,用戶想要得到的是滿足需要的實際內容,所以輸入的檢索詞也必具有實際意義,這樣的檢索詞在語意和構成上應該符合藏文的相關規范。對這樣的檢索詞進行分析、建立索引應該能滿足檢索系統的要求。

2) 藏文詞典是實現相關詞提示的一個很好參考模型

在信息檢索系統中,詞典是進行詞句分析的一個參考模型。藏文詞典本身就具有良好的藏文分詞功能,且能幫助用戶糾正檢索詞輸入中的文法錯誤,結合藏文詞典和檢索詞,可以更好地滿足藏文分詞需要。

3) 藏文詞語的權重是實現相關詞提示排序功能的重要指標

詞語的權重是實現相關詞提示的一項重要指標。在信息檢索的過程中,大家都關心的詞可以賦予更高的權重。在藏文相關詞提示系統中,依據藏文詞語的權重進行排序,權重高的排在前面,以此類推。

3 藏文自動提示功能的實現及測試

3.1 藏文相關詞提示的實現

在藏文相關詞提示的具體實現中,限于提示詞的數目,相關詞的提取和排序就變得非常重要。設計合理的相關詞提取和排序可以使用戶得到更好的體驗。

1) 藏文詞典排序算法

藏文詞典排序算法按照現有藏文詞典的排序方法,即所有藏文詞語按照藏文基字的先后順序分組排列,每組中各個詞語按第一個音節為獨體字、有后綴(后加字和再后加字)、有元音、有下加字、有上加字(逐步從簡單到復雜)的順序排列,對于具有元音的詞語也與前者相同,即從基字加元音、有后綴、有下加字、有上加字的順序排列[7][8]。排序的一種實現方法是:首先,把所有的藏文詞語按照基本輔音字母分類成四十一個組,并保持國際編碼標準中輔音字母的先后順序;然后,在同一個組內,根據該字所具有的構件元素及構件元素之間的優先級來排列藏文詞語;其次,每一個構件元素內部的所有字符要有序;最后,整體藏文的優先級最大者先排[9][10]。根據文獻[7],藏文詞條大約常用的是1.4萬余條,那么,怎樣從這1.4萬余條詞語中選取數量有限的相關提示詞,選取的這些提示詞是否與用戶搜索的信息有關聯,這是藏文相關提示詞設計時要考慮的。考慮到從詞典抽取出的一系列相關詞本身和用戶輸入的檢索詞的相關度并不是很大,所以在本系統的設計中我們只用藏文詞典來進行糾錯和藏文分詞。

2) 基于查詢日志的藏語相關詞的實現方法

用戶通過信息檢索系統輸入檢索詞時,檢索系統會自動記錄用戶的查詢詞和點擊的相關文檔,記錄的文件稱為查詢日志[11]。通過查詢日志,可以清楚地分析出用戶使用頻率最高的藏文查詢詞。通過信息檢索中的聚類技術[1],對查詢詞進行聚類,這樣就可以得到相關度較高的一系列藏文相關詞了。當用戶輸入檢索詞時,系統根據用戶輸入的檢索詞的相關字母,選取其中以同樣字母開頭的一些權重較高的詞組,利用權重的大小,進行排序,最后通過檢索系統用戶界面,以下拉列表的方式,返回給用戶一組相關提示詞。其實現框圖如圖3所示。

圖3 藏文相關詞提示的實現框圖

3.2 測試結果

本系統使用了940篇藏文文檔,為了說明測試結果,只選擇了其中的五個藏文詞語用于相關詞提示,詞語及權重如表1所示,本系統的搜索引擎采用開源Lucene系統。通過表 1可以看出,我們選取的藏文詞語的第一個字母是一樣的,也就是說,本系統的藏文聚類是按照藏文的實際書寫順序,而不是其具體實際語意。

表 1 藏文在不同文檔中的權重

圖4 顯示了輸入檢索詞后具體的實現界面,從該界面可以看出,系統會自動列舉權重比較高的5個藏文相關詞并根據權重進行排序,且這些相關詞具有確切的語意。用戶可以從中選取檢索的關鍵詞或繼續檢索以滿足自己的需要。

圖 4 信息檢索系統中藏文相關詞提示的實現界面

4 結束語

藏語作為一個民族語言,其信息處理技術起步較晚,但已經有了很大的發展。鑒于藏文文體的復雜性,藏文在信息檢索方面的研究與國際上還存在著一定的差距,但隨著網絡的發展,更多的研究人員將投入到藏文信息化的領域上來,藏文在信息檢索方面將會有更進一步的發展。該文相關研究成果獲得自治區自然科學基金項目《實施電子政務平臺網絡信息安全及應急預案研究》資助。

參考文獻:

[1] Christopher D.Manning,Prabhakar Raghavan,Hinrich Schutze.信息檢索導論[M].王斌,譯.北京:人民郵電出版社,2010.

[2] 江獲,董穎紅.藏文信息處理屬性統計研究[J].中文信息學報,1995,9(2):37-44.

[3] 才智杰,才讓卓瑪.基于語料庫的藏文字屬性分析系統設計[J].計算機工程,2011,37(22):270-272.

[4] 劉匯丹,芮建武,吳健.藏文網頁的編碼識別與轉換[C].中文信息處理前沿進展――中國中文信息學會二十五周年學術會議論文.北京:清華大學出版社,2006:573-580.

[5] http:///html/rfc2781

[6] 陳玉忠,李保利,俞士汶,等.基于格助詞和接續特征的藏文自動分詞方案[J].語言文字應用,2003,1:75-82.

[7] 東噶洛桑赤來.東噶藏學大辭典[M].北京:中國藏學出版社出版,2002.

[8] 格桑居冕,格桑央京.實用藏文文法教程[M].成都:四川民族出版社,2004.

[9] 邊巴旺堆.基于ISO/IEC10646藏文編碼字符集標準的藏文排序算法設計與實現[D].拉薩:大學,2009.

主站蜘蛛池模板: 布尔津县| 淮南市| 平原县| 滁州市| 古浪县| 古交市| 两当县| 亳州市| 昌都县| 青龙| 邵阳市| 边坝县| 庄河市| 天镇县| 嘉峪关市| 金昌市| 米脂县| 衡东县| 连云港市| 玉山县| 台中县| 高唐县| 清水县| 富裕县| 拉孜县| 闵行区| 嘉鱼县| 务川| 濮阳县| 玉树县| 张家口市| 苍梧县| 巫山县| 专栏| 平潭县| 松江区| 北辰区| 新营市| 荃湾区| 德昌县| 宁都县|