數據信息論文賞析八篇

發布時間：2023-03-21 17:09:54

序言：寫作是分享個人見解和探索未知領域的橋梁，我們為您精選了8篇的數據信息論文樣本，期待這些樣本能夠為您提供豐富的參考和啟發，請盡情閱讀。

數據信息論文

第1篇

城市軌道交通信號系統的DCS網絡包含有線部分和無線部分。有線網絡部分是指軌旁設備之間的數據通信，為信號系統提供專用有線信息傳輸，為控制中心、車站、場段之間提供有線傳輸通道，建立局域網連接。無線部分主要是列車上的移動無線設備和地面軌旁無線單元之間建立的車地雙向通信。如上所述，在信號系統的DCS網絡中，可以根據不同的組網方式，構建不同的網絡結構，形成連接信號系統相關設備的通信網。而在這樣的網絡中，傳遞的信息就包含大量的管理信息、行車數據信息、ATS信息、維護信息、數據記錄信息等。DCS系統網絡連接設備一般連接方式需要說明的是DCS網絡結構是多樣的，隨著實際地鐵線路情況、所連接的設備情況、以及技術發展和應用情況有不同變化。從圖1中可以看出，信號系統DCS網絡具有連接設備類型多、數量大，信息傳輸種類繁多的特點。如果在DCS網絡中信息沒有合理的傳輸定義，使網絡中任何一個數據幀的傳輸都要遍及整個網絡，導致所有與網絡連接的設備都接收到，這樣就會嚴重的消耗掉網絡整體帶寬。因此，在DCS網絡傳輸信息量較大時（如早、晚運行高峰時等），如不對網絡進行合理設置，就可能產生網絡風暴。網絡風暴發生時，與網絡連接的部分設備也可能會由于無法應對網絡流量的大幅波動導致故障，進而引發故障面擴大的情況發生，對運營產生嚴重影響，這就需要對網絡中的信息傳輸進行合理優化。

2VLAN技術特點及在DCS網絡中的應用

VLAN技術是將局域網設備從邏輯上劃分成一個個網段，從而實現虛擬工作組數據交換。由于VLAN設置是在交換機上按邏輯來劃分，而不是傳統上的只能從物理上劃分，因此VLAN技術的出現，可以滿足根據實際應用情況，將同一物理局域網內不同用戶邏輯地劃分成不同的廣播域需求。在設計VLAN并實現應用時，首先要確定如何劃分VLAN。較為常見的VLAN劃分方式包括：按照端口劃分，按照MAC地址劃分、基于網絡層劃分、以及基于IP廣播和基于規則等方式。其中應用最為廣泛、也是最有效的，是按照端口劃分的方式，這種劃分方式是根據以太網交換機的交換端口來劃分的，將交換機上的物理端口分為若干個組，每個組構成一個虛擬網。由于基于端口劃分VLAN的優點是定義VLAN成員非常簡單，只要在接入交換機上進行相關設置即可，操作相對簡單，適合任何大小的網絡。同時，這種配置方式適用于網絡環境比較固定的情況，與DCS網絡構建后即在運營中不會輕易改變的實際情況較為符合，因此在地鐵信號系統DCS網絡交換機的配置中，一般都可以使用按照端口劃分VLAN的配置方式。以赫斯曼交換機為例，按照端口劃分VLAN，為不同端口賦予不同ID后的界面顯示情況綜上所述，為了有效避免信號系統DCS網絡風暴的發生，可以將交換機端口劃分到不同VLAN中。其原理為：在不同端口發出的所有數據幀上增加一個代表所屬VLAN編號的ID，各個交換機端口只有在接收到所屬VLANID的信息時，才會對該信息進行拆分處理，而在收到標有其他VLANID信息時，只會將該信息按照目的地址進行轉發。這樣就實現了通過在DCS網絡交換機上應用VLAN技術，有效控制網絡流量、降低網絡風暴發生概率的目標。并且通過在交換機上進行VLAN的劃分，可以起到減少項目建設的設備投資成本、簡化DCS網絡管理、提高網絡安全性的作用。這里需要提出的是，有必要找到適合于信號DCS網絡的劃分原則，結合實際應用情況，將不同級別的信息進行合理區分。

3適用于DCS的VLAN劃分原則

由于地鐵信號系統DCS網絡具有連接設備數量、類型較多，信息傳輸種類繁多的特點，在按照端口劃分的VLAN配置方法對信號DCS網絡交換機等進行配置時，需要尋找到合適的原則，將信號系統DCS網絡中不同設備、不同信息類型進行全網的統一配置，既能有效避免網絡風暴，又有利于維護人員進行維修檢查。這就需要根據網絡端口是否有用、該端口在網絡中的作用、所傳輸的信息內容和特點等特征，將網絡端口有序劃分。例如，在網絡的列車自動控制（ATC）信息、列車自動監控（ATS）信息、維護管理信息等帶有不同功能及目地的信息，劃分到不同的VLAN中。在信息有效傳輸的同時，也可以提高網絡的安全性能。建議按照以下原則進行層層劃分。

1）由于信號系統涉及列車行車安全，因此可先將交換機上多余端口統一劃入“無用端口”的VLAN中，這樣即使有其他設備接入到該端口上，也不會對有用端口間的網絡通信造成影響。

2）進一步將有用端口進行分類，如該端口在信號DCS網絡中只做收發，不對信息進行拆分和處理，即可將其劃入“管理類”的VLAN中。

3）在DCS網絡中，與“管理類”信息對應的是“業務類”信息，在此類信息中，建議先將涉及到列車控制安全的ATC信息獨立劃分出來，同時由于此類信息較為重要，需設計兩路，可以劃分至兩個不同的VLAN中。

4）另外，“業務類”信息還包含其他非ATC信息，也就是非安全信息。對這類信息的劃分，首先將其中的ATS信息獨立劃分出來，同樣建議為兩路。

5）同時，非安全類的信息也包含維護管理類信息，如維護支持、電源監控類等信息也需要劃分到單獨一個VLAN中，此類信息可以不進行冗余設置。

6）其他非安全類信息也可以通過實際情況進行VLAN設置，可以獨立VLAN，也可統一劃入一個VLAN，根據實際情況進行設置即可。建議的VLAN劃分原則，以及該原則對應在信號系統中的傳輸內容示意。

4總結

第2篇

關鍵詞：信息技術教育。

信息技術教育的主要目的是讓學生在了解計算機文化、初步掌握一些計算機基本知識和技能的同時，進一步激發學生的學習興趣、增強信息意識和創新意識、有效培養學生對信息的收集、處理、應用和傳輸的能力，培養學生的自學能力和創造能力，在開發智力、實現學生信息素質和創造素質的教育。教學中要時刻注意信息技術教學不僅僅是傳授計算機的基礎知識，更不能像社會上片面追?quot;學而致用"的職業培訓，而應把計算機作為一種現代化工具，來提高學生的綜合素質，培養他們用信息技術手段來解決問題的各種能力。

那么，怎樣才能做好信息技術課的教學呢？信息技術教學可分為三層臺階：一、理論課教學，二、上機課教學，三、課外實踐。所謂理論課教學主要內容是課程的引入、基本知識與基本技能；上機課教學主要內容是讓學生在鞏固性練習中，掌握知識，形成技能；課外實踐主要內容是教會學生如何將信息技術應用到實際中去。理論課教學是前提，上機課教學是手段，課外實踐教學是根本。下面結合自己的教學實際，談談如何踏好這三層"臺階"。

一、理論課教學

1、上好第一節信息技術課。

俗話說：良好的開端是成功的一半。教師為學生上的第一節信息技術課要結合典型事例（最好輔以相應的多媒體演示）使學生對計算機的發展、應用有一個比較系統、全面的了解，并從中感悟到學習信息技術的重要性，激發出學習的欲望，明確學習任務。在此基礎上，要讓學生明白：為了最大限度地利用有限課時，一方面教師對學習內容和學習目標要做精心的設計和安排；另一方面，還需要他們怎樣的密切配合等等，讓學生有一個必要的心理準備，為今后的學習，尤其是上機課能充分利用好45分鐘開個好頭。

2、課堂教學應以能力的培養為主。

對于新的課程內容，只要學生能自學弄明白的問題，教師就不要用講授的方式進行教學。教師可以設計出層次分明的思考題，引導學生認真閱讀教材，用"自己學得"的知識解決"實際問題"，并提供讓學生"各抒已見"的機會。最后教師再通過課堂小結使教學內容系統化、完整化。而對于新技術、新名詞的教學，則要鼓勵學生大膽的設想與追蹤。從而培養學生的自習能力、綜合能力、創新能力。

3、利用多媒體教學手段，提高教學效率。

多媒體教學構建了新型的教學模式，能給學生創設一個良好的認知環境，可以加深學生的識記成效，培養和發展學生的思維能力、觀察能力、想象能力和創造能力。因此，信息技術學科教師要能熟練運用多媒體教學手段，使自己的課堂教學內容豐富而不繁雜，教學過程緊張但不忙亂，自身的教學效率與計算機的高效性和諧一致，使學生親身感受信息技術給人類帶來的全新變化。

4、理論課教學課時應遠小于上機課。

信息技術是一門基礎工具課程，是用來處理其它事務的手段，因此培養信息技術基本技能是該課程的主要任務。所以傳統的課堂授課形式在信息技術教學中只適合完成像基礎知識、語言算法、小結討論等內容的教學。上機課才是學生通過動手來領會、鞏固和運用知識的最有效的手段，是培養技能的基本途徑。

二、上機課教學

充分、有效的利用好學校現有的計算機設備是信息技術教學的關鍵，因此教育部已擬定，上機課時應占信息技術課教學的70%以上。

1、有關操作的教學內容應當安排在機房進行。

信息技術課是一門實踐性很強的課，因此有關操作性比較強的教學內容（如：Windows98的操作、Word的操作）應安排在機房進行。對配有多媒體教學網或大屏幕投影機的現代化機房，能使教師有更多的機會營造有利于學生"主動發展"的空間。對暫不具備以上條件的機房，也應常備一臺投影儀，教師要精心設計制作投影片以期最大限度地滿足高效率教學的需要。

2、采用任務驅動的教學方法，培養學生自學能力。

在上機課之前，要向學生提出本節課學習的要求、明確學習任務，解決好為什么學的問題。學生通過自己閱讀教材，提出問題，并引導學生進行驗證操作，使學生在自己不斷的解決問題當中體驗成功的快樂，可增強學生的自信，并逐漸養成求知探索的習慣。此后結合教學大綱要求，提出每一個學習階段的學習任務。可能將學習任務明確化、通俗化、具體化。同時注意將任務簡化，同時將學生任務簡化為基礎與技巧兩部分，便于讓學生抓住重點，保持良好的學習情緒。比如：將Word使用分為基礎部分（常用菜單、常用與格式工具欄使用等）與技巧部分（專用工具欄、復雜選項、復雜格式等），基礎部分內容嚴整量少，便于教學，務必嚴格把關，確保每位學生都學會，技巧部分注意方法教學，不必一一細講，要引導學生學會摸索學習。也要注意將任務分層，對不同程度的學生提出相應難易的任務，因材施教。

3、讓學生在鞏固性練習中，進行知識的整合創造。

創造素質教育的一大特點就是跨學科。傳統的學科教育往往強調了線性思維，而忽視了發散思維，這樣是很難培養出具有創造素質的人才的。計算機的工具性，為以學生為主體的跨學科教育提供了極大的便利條件，教師應讓學生在鞏固性練習中，多進行知識的整合創造。如用"畫筆"進行美術創作，用Word設計賀卡、辦報，用Music作曲、用Excel分析班級成績，用Internet進行信息交流等。這種學以致用的教學方法既有利于完成信息技術課程的教學任務，又有利于開發學生智力、促進學生主動發展，使信息素質和創造素質的教育落到實處。

4、上好程序設計課，培養學生創造力。

學生用所學語句自己組合成程序，用來解決某些問題：畫圖、奏曲、解趣味數學題、進行成績分析等等。這個過程對學生而言就是創造，它對學生的思維能力、解決問題的能力、規劃能力和創造能力的培養是其它課程不能替代的，是性能價格比非常好的培養學生創造力的有效手段和途徑。

三、課外實踐課

"用計算機處理信息是二十一世紀的公民應具有的基本技能之一"已成為人類的共識。因此，在中小學信息技術學習中會涌現出許多學生計算機愛好者，這些學生不滿足課堂所學的知識，對計算機的許多專業知識和應用技術（尤其是電子游戲）表現出濃厚的興趣。學校、教師、家庭應通過有組織、有計劃的課外實踐活動對這些學生的愛好給予保護、培養和正確引導，以保證學生在全面發展的基礎上學有所長，學有所用。

課外實踐作為課堂教學的拓展和延伸,可分程序設計和應用技術兩大類進行輔導。

1、程序設計小組

中小學各個階段的程序設計課外實踐應與青少年信息學奧林匹克競賽相結合。由于此類競賽對學生綜合素質要求很高，只有心理素質好、文化課成績優異、熟練掌握一種計算機高級語言的學生才有可能在較高級的比賽中取得好成績。因此在課余可組織程序設計興趣小組。如Pascal語言的程序設計，通過學習使學生掌握分析問題、解決問題的方法。為國家計算機高級人才的早期培養盡基礎教育的責任。

2、應用技術小組

在應用技術的課外實踐中可把計算機當作信息處理的工具,讓學生在整合各科所學文化知識的基礎上進行豐富多彩的創作和信息交流活動。如用Frontpage自制網頁；用Word設計公益廣告、賀卡；用"畫筆"或Photoshop創作美術作品、電子相冊；用Authorware制作課件；普曲或合成音樂；通過Internet進行信息傳遞、資料查詢等等，這些活動打破了學科界限,使學生在輕松愉快地學到、鞏固了相關學科的知識和技能的同時，有效提高了應用已有知識進行創造和規劃的能力，深受學生喜愛。由于指導這些活動對教師的綜合素質要求較高，所以這樣做也有利于促進教師不斷提高業務水平和綜合素質。

總之，信息技術教育應以培養學生的信息素養和實踐能力為主要教學目標，信息素養是信息技術教育的主要教學中心，信息技術教育必須圍繞這個中心開展相應的教學活動，使學生的信息素養成為與讀、寫、算一樣重要的的終身有用的基礎能力，同時，信息技術教育必須兼顧學生的全面發展和多種能力的培養，注重學生的精神、道德、文化和社會等多個方面的發展，培養學生的批判性思維、創造性思維和問題解決能力，因此，信息技術教育是以培養學生的信息素養為核心，面向學生全面發展的課程。

〖參考文獻〗

《中國電腦教育報》。

第3篇

關鍵詞：單片機電話主叫信息識別FSK數據通信

電話主叫識別信息發送及接收（俗稱來電顯示），簡稱CID（CallingIdentifyDelivery），是電信局向被叫電話用戶提供的一種服務項目，是指在被叫用戶終端設備上顯示主叫電話號碼、主叫用戶姓名、呼叫日期和時間等主叫識別信息并進行存儲，以供用戶查閱的服務項目。被叫用戶根據顯示的主叫識別信息而決定是否接聽電話，可以避開一些不愿接聽或不友好的電話。利用這個功能可以進行FSK信息解碼的電話網數據通信，應用于實際生活中。

1電話主叫識別原理和傳送協議

實現電話主叫信息識別業務的基本方法是，發端程序交換機將主叫電話號碼等信息通過局間指令系統傳磅給終端交換機，終端交換機再將主叫識別信息以移頻鍵控FSK（Frequency-ShiftKeying）或雙音多頻DTMF（DualToneMulti-Frequency）方式，在第一次振鈴或第二次振鈴間隔期前傳送給被叫用戶終端設備。我國的通信行業標準明確規定，統一采用FSK方式提供主叫電話來顯示服務。在一次呼叫中，若被叫用戶申請了CID業務，則電信局的終端交換機就會向該被叫用戶傳送主叫識別信息數據。傳送流程與時序如圖1所示。

其中A、B、C、D、E為數據傳送時的狀態持續時間，各段時間值如表1所列。在數據傳送前或傳送過程中，如果用戶摘機，則傳送停止，但呼叫處理正常進行。

表1CID信號傳送各段時間值

符號時間值說明

tA1s第一次鈴流信號

tB0.5s<tB<1.5s第一次振鈴結束與數據傳送開始之間的時間間隔

tC≤2.9s傳送數據的時間，包括信道占用信號和標志信號

tD≥200ms數據傳送結束與第二次振鈴開始的時間間隔

tE1s第二次鈴流信號

tB+C+D≤3.6s各時段可根據具體情況確定

2主叫識別信息數據格式

FSK主叫識別信息數據的傳輸格式有兩種：單數據消息格式SDMF（SingleDataMessageFormat）和復合數據消息格式MDMF（MultipleDataMessageFormat）。前者的結構簡單，可容納的信息內容較少，如主叫號碼、日期和時間；后者的結構比較復雜，可容納的信息長度較長，除單數據格式內容以外還可以主叫用戶的姓名等。本文主要介紹FSK主叫信息數據格式的接收。

單數據消息格式由消息頭和消息體組合，消息頭由消息類型和消息長度組成，它們均為8位字。消息類型的值來識別消息的特征；消息長度指明后面所跟消息字的長度。消息體包括交換機需傳給終端用戶的消息。消息體可容納1～255個8位的消息字。每個字用8位帶校驗位的7位ASCII編碼字符集表示。

一個完事的消息幀由信道占用信號、標志信號、數據信息和校驗字組成。信道占用信號和標志信號用來提示電話終端準備接收數據；校驗字用來作差錯檢查，如圖2所示。

①信道占用信號。這是發送主叫信息時要首先發出的頭標志，由一組300個連續的“0”和“1”交替地組成。其第一個位為“0”，最后一個位為“1”。在通話狀態下，此信號不發送。

②標志信號。在掛機狀態下，程控交換機向用戶發送主叫信息時要先發送的第二個標志信號，由180個標志位（邏輯“1”）組成。在通話狀態下，此信號不發送。

③標志位。程控交換機根據線路使用情況隨機插入的標志位，由0～10個邏輯“1”組成。

④數據字。主叫信息，每個數據字之前先行一次“0”作起始位，在最后加一位“1”作結束位，每個數字的最低位先發送。這樣，實際每個字為10位，即1PXXXXXXX0，其中P為奇偶校驗位。

電話主叫信息數據傳送時，信道占用信號首先發送，后接標志信號，最后連續發送數據字。根據數據傳送情況，間隔地插入一些標志位。一般標志位會加在如下字的傳送之間：

a.消息類型字與消息長度之間；

b.消息長度字與第一個參考數字或消息字之間；

c.參數類型字與相應的參數長度字之間；

d.參考長度字與第一個參考字之間；

e.最后一個參數字與下一個參數類型字之間；

f.最后一個參考字或消息字與校驗字之間。

單數據消息格式數據傳送按消息類型（04H）、消息長度、消息字、月、日、時、分、主叫號碼（或“O”或“P”）的順序排列組成消息進行傳送。所有的消息字和參數字都有奇數偶校驗位，采用奇偶校驗的方式傳送。

3電話FSK信息通信電路設計

本文以FSK信息解調器SM8220P芯片與單片機及外電路接口為例，介紹FSK信息的通信接收方法。SM8220P解調器是日本NPC公司生產的雙列直插、低功耗CMOS集成電路FSK解調芯片，其解調器的引腳功能如表2所列。

表2SM8220P引腳功能

符號引腳功能

TIP-RING1,2電話信號輸入端。信號輸入必須隔直流

AGND3模擬地，要通過一個電容接地

RDIN4振鈴檢測輸入。要把振鈴信號經衰減后連接到此引腳

RDRC5振鈴檢測RC延時電路，低電平有效

RDET6振鈴檢測輸出，內部接施密特觸發電路。當為低電平時，表明檢測到振鈴信號輸入；不用時應接地

PWDN7掉電控制，平時應保持為低電平。若為高電平，進入掉電工作模式，COSCOUT、CDET和DOUT自動被設置成高電平，AGND、FOUT被設置成高阻抗狀態

GND8器件地

OSCIN/CLKIN9振蕩放大器輸入，外部振蕩放入器信號經此引腳輸入

OSCOUT10振蕩放大器輸出，使用外部振蕩信號時必須開路

CDET11載波檢測輸出端，低電平有效。為低電平時，表明此時有FSK載波信號輸入

NC12空腳

DOUT13數據輸出，平時為高電平。當CDET=0時，表明此時電話經上有一個有效的FSK信號輸入，經解調后由該腳輸出

DMIN14解調器輸入端

FOUT15FSK帶通濾波器輸出端，通過一個電容耦合連接到DMIN

VDD16電源正極（3～5.5V)

SM8220P遵循Bell202和ITU-TV.23協議標準，以連續二進制脈沖頻移鍵控信號的方式傳輸，傳輸速率為1200bps。支持FSK號碼顯示和姓名顯示等多種功能；芯片內部包含電源掉電檢測電路、振鈴檢測電路和載波檢測電路；信號輸入檢測靈敏度高，電源工作電壓較寬（3～5.5V），是進行電話FSK信息解碼通信的較好的集成芯片。

為實現電話FSK信息的接收，采用P87LPC764單片機控制SM8220P電路，以完成電話FSK信息解碼通信的工作。電話FK信息通信具體電路如圖3所示。

從圖3中可知，對于從電話線上傳輸來的FSK信號，信號傳送在第一次振鈴和第二次振鈴之間。振鈴信號經過整流、分壓，加到TIL113光電耦合器件的發射管上，使發射管有電流通過而發光，照射到光敏三極管的基極，臻使光敏三極管飽和導通。在R6上得到大于1V的脈沖信號，輸入到單片機外部中斷0，喚醒單片機準備接收。0.5s后FSK信號經過C3、C4、R1、C2的隔直和衰減，輸入到FSK接收器SM8220P的差分輸入端TIP和RING腳，將FSK信號讀取解調后從DOUT腳輸出ASCII碼的串行序列，由P87LPC764單片機接收處理，提取出相應的電話FSK信息，發到多功能LED顯示模塊MAX7219驅動數碼顯示和24C64保存。

4FSK信息接收通信軟件設計

單片機對SM8220P輸出的ASCII碼串行序列的識別過程，由接收和數據整合兩部分組成。由于FSK信號波特率為1200bps，每發1位的時間是833us，因此，可以設定定時器每833us接收1位，每10位提取出1個數字。如此反復循環，直到接收完全FSK信息。當有電話來時，在第一聲振鈴后，單片機開始準備檢測接收信號，SM8220P開始接收300個由0、1組成的頻率為1200Hz的信道占用信號和180個“1”標志信號，緊接著接收主叫號碼和時間。每收到1個數字，SM8220P都把它變換成10位（1PXXXXXXXX0）的串行序列，由13腳輸出傳送給P87LPC764單片機，P87LPC764經過精確的定時編程將其檢測整合出相應的FSK號碼、時間等數據，完成FSK信息解碼、接收通信、接收到的電話號碼可以保存在24C64串行E2PROM中，也可以輸出到LCD上顯示。SM8220P的11腳用來提示電話線上是否有新的FSK信息的輸入。若有新的FSK信息輸入，此引腳將產生低電平。單片機接收FSK主叫信息可以采用定時中斷方式，也可以采用延時查詢的辦法進行。電話FSK信息接收通信程序流程如圖4所示。

第4篇

數據挖掘技術在企業的信息化建設中所擔任的角色是實現數據信息到商業知識的轉化。首先需要明確數據挖掘技術的處理對象，明白商業活動的主題；其次，需要對商業的主題進行分析，并搜集與之相關的數據利用各種技術對數據進行整理分析，并載入適合的數據挖據的算法中，建立模型，再從模型中提取出有用的商業信息，再根據分析所得結果調整算法，以數據和信息的可靠性為依據對結果進行判斷；再次，將獲得的商業知識融合到企業的信息平臺，利用人機界面對企業的決策活動予以支持。另外值得注意的是，由于數據挖據技術屬于高層次的技術，又關系到企業的業務機密，因此，需要極為專業的技術人才專業管理。

2如何實現數據挖掘在企業的信息化建設中的應用

在企業進行業務的操作過程中往往會產生大量需要處理的數據，這就為數據挖掘的應用提出了要求，數據挖掘的運用使企業的大量的數據得到了梳理，分析信息的能力提高，在企業今后的市場開拓記憶日常的運行中發揮了重要的作用，促進企業的競爭力的提高，那么，數據挖據具體在企業的信息化建設中如何應用呢，下文將予以介紹。

2.1利用數據挖掘技術實現客戶信息的有效管理具體來說就是通過對客戶信息進行分析，為客戶建立一個合適的購物模式，以滿足客戶的需求為重，這是處理好企業與客戶之間的關系的關鍵。有相關數據顯示，企業在獲得一個新的客戶過程中所花費的成本比維系一個老客戶的成本高出6倍-9倍之多，一個老客戶的流失是以10個新客戶的獲得為代價的，由此可見，對于企業來說老客戶的維護工作至關重要。通過數據挖掘技術可以得到老客戶的大量的信息，并對其交易記錄、統計信息進行分析后，可以有目的性的對流失的客戶進行分析，找出客戶流失的原因并為新客戶的建立提供模型和經驗，有效地對意向客戶和流失客戶進行判斷，起到企業與客戶的關系的改善的作用。

2.2利用數據挖掘技術進行市場營銷的分析與管理在市場營銷中，數據挖掘的作用在于可以促進市場的分工，以“客戶過去的消費行為可以說明今后的消費傾向”為假設，然后對客戶的信息進行分析，確定某一群體客戶的消費興趣，消費的趨向于需要，進而對消費者的下一次或者下一步的消費行為作出判斷，然后再以此為基礎，將識別出來的客戶作為一個消費群體，以此制定營銷計劃，這與傳統的不以消費者的實際需求為參考而進行大規模營銷的手段相比較，在成本的節約方面貢獻極大，可以帶給企業更多的利潤。在市場營銷中的應用上，各種數據挖掘算法都得到了廣泛的應用，每種不同的操作手段都可以引導商家做出滿足消費者需求的決策與判斷。

3結束語

第5篇

近年來，隨著互聯網技術的發展，大數據越來越受到關注，其應用逐步滲透至多個行業，開啟了全新的數據時代。數據是征信業務開展的基礎資料，征信活動主要是圍繞數據進行采集、整理、保存、加工，并最終向信息使用者提供。大數據不僅為征信業發展提供了極為豐富的數據信息資源，也改變了征信產品設計和生產理念，成為了未來征信業發展最重要的基石。我國征信業發展尚處于起步階段，在大數據時代存在征信法律制度和業務規則不夠完善、征信機構數據處理能力有待提高等問題。未來征信業面臨的機遇和挑戰并存，研究大數據時代征信業的發展具有重要意義。

大數據時代征信業面臨的機遇和挑戰

目前，對大數據無公認的定義，一般認為大數據是指所涉及的資料量規模巨大到無法通過目前主流軟件工具，在合理時間內達到擷取、管理、處理、并整理成為服務于經營決策的資訊。大數據的出現，使征信業發展面臨的外部環境發生了巨大的變化。

(一)大數據時代征信業面臨的機遇。

1.優化征信市場的格局。

隨著征信機構市場化運營機制的確立，將會有更多信息資源優勢的企業借助互聯網、大數據等信息技術的創新進步，從征信業薄弱環節切入，通過服務創新或產品創新打破原有的征信市場格局。一是電商企業將組建征信機構。以阿里巴巴為例，其利用淘寶、天貓、支付寶平臺上的行為數據和信用情況，建立成了涵蓋數十萬企業的數據庫，具備了開展網絡征信服務的基礎和實力。二是金融機構建立征信機構。例如平安集團擬整合網貸信息、銀行信貸信息、車輛違章信息等，建立金融數據挖掘中介機構。三是新型征信機構應運而生。一些大數據公司依靠技術手段，以電子商務、社交網絡為平臺，采集信息，提供信用信息服務，可能成為新型的征信機構。

2.推動征信業的轉型升級。

大數據給征信業帶來轉型升級的歷史機遇，未來的征信業將以智能數據分析系統為平臺，利用大數據挖掘技術，支持征信業發展創新。大數據支持征信業升級和轉型主要體現在二個方面。一方面大數據促成征信業建立全新的風險控制體制，向有效監管轉型。大數據技術對客戶信用信息進行深度挖掘，實時監控，防范潛在的信用風險。另一方面大數據支持征信機構向精細化管理轉變。大數據的核心優勢在于信息挖掘，精細化管理的首要條件是充分信息化，包括業務信息化和管理信息化。

3.促進征信業差異化競爭。

征信機構通過采用不同的數據來源，不同的數據處理方式，針對不同的客戶，開發出不同的產品，滿足不同層次客戶的市場需求，實現差異化競爭。例如，金融機構對征信服務的需求將從單個借款主體的信用報告，擴展到運用信用信息拓展網絡影響和金融服務渠道。P2P網絡借貸、電商金融等業態需要借助信用信息共享防范風險，降低交易成本。

4.拓展征信數據來源。

大數據使征信數據來源呈現多元化、多層化和非結構化的特點，更加全面和真實地反映信息主體的信用情況。征信機構從在政府部門、金融機構等實體機構中采集信息，轉向從互聯網等虛擬世界中獲取信息。在數據采集的廣度和深度上，征信數據量將激增，采集包括證券數據、保險數據、商業信用數據、消費交易數據和公共事業繳費數據等，全面地覆蓋與信息主體相關的各項因素。

(二)大數據時代征信業面臨的挑戰。

1.現有征信業務規則與大數據時代不匹配。我國有關征信業的法律法規的規制對象主要是傳統金融領域，《征信業管理條例》及其配套制度初步構建了我國征信業的法律法規框架，但是《征信業管理條例》是否滿足大數據時代征信業務的規則要求，尚未得到市場驗證。目前，缺少對大數據時代征信活動的規范，如有關大數據采集、整理、保存、加工和處理的制度要求。因此，還需要進一步細化和完善征信業務規則，以更好促進大數據時代征信市場的發展。

2.征信業監管技術和水平需改進。大數據時代給征信業發展帶來深刻影響，同時也對征信業監管提出了更高的要求。要適應大數據時代的征信監管需求，征信監管水平要能跟上大數據征信的發展水平，監管政策要符合大數據的基本規律，監管人員要具有適應大數據的知識和能力。在行業自律監管方面，我國行業監管尚未發育成熟，行業標準尚未統一，行業規范以及行業職業道德等內容尚未完善。

3.信息安全和隱私保護形勢嚴峻。隨著數據的進一步集中和數據量的急劇增長，對海量數據進行安全防護變得更加困難，數據的分布式處理也加大了數據泄露的風險，隱私保護和數據安全成為制約大數據發展的瓶頸。大數據時代下的征信業同時具有了大數據和征信兩個特性，對隱私保護和數據安全的要求更高。

4.數據處理能力亟待提高。如何有效處理大數據，是大數據發揮作用的重要環節。益百利等大型征信機構在數據處理方面已經采取多層次數據挖掘等先進技術，利用私有云平臺，對系統中海量數據進行處理和研發，減少主觀判斷，提高風險預測的準確性。但是目前我國征信機構發展起步較晚，缺少對數據處理的核心技術，導致數據分析結果不能夠準確的識別個體或組織的行為。

5.硬件基礎設施需要全面升級。過去征信機構存儲征信數據主要是在本地建立數據庫，大數據時代隨著數據量呈幾何級數的增加，征信機構硬件技術的發展已經跟不上數據容量的增長速度，數據存儲面臨較大壓力。

大數據時代征信業發展的措施與建議

隨著大數據時代的到來，未來征信業發展要從制度設計、技術進步、信息共享、監督管理、隱私保護等方面不斷創新，促進征信業在大數據背景下的跨越式發展。

(一)建立符合大數據的征信法律制度和業務規則體系。現有的征信法律體系都是基于傳統數據模式下制定的，難以滿足大數據等新技術條件下征信業發展的制度需求。在征信業務開展過程中，大數據的收集使用可能涉及國家信息安全、企業商業秘密、公民隱私等，為了給大數據條件下征信業發展提供制度保障，需要從征信立法層面完善信息安全和數據管理的法律制度，明確大數據背景下數據采集、整理、加工、分析、使用的規則，確保大數據時代征信業發展有法可依。

(二)加強征信產品創新。隨著可獲得的數據量呈幾何倍數的增加，征信機構通過深度挖掘和使用這些數據，就可以極大地拓展征信產品的種類，不僅能夠提供信用報告查詢等基礎服務和產品，還可以提供其他綜合性產品，滿足社會各界的需求。從征信產品的滿足層次高低的不同，可以分為宏觀、中觀和微觀的征信產品。宏觀層面，征信機構通過大數據分析可以對系統性、全局性的風險信息進行預測。中觀層面，征信機構的海量數據包含大量時效性和政策含義都很強的信息，可以靈活多樣地進行多維度組合分析。把這些信息整理和挖掘出來，建立對應的指數體系，有助于行業監管。微觀層面，在信用主體(包括企業和個人)同意的前提下，征信機構可以提供每一個信用主體的信用報告、信用評分、身份驗證、欺詐檢測、風險預警、關聯分析等多種數據服務。

(三)提高大數據技術處理能力。大數據價值的完整體現需要多種技術的協同。數據抽取與集成、數據分析以及數據解釋，是大數據時代征信數據處理的三個重要環節，在數據處理過程中搜索引擎、云計算、數據挖掘等新技術使用必不可少。因此，征信機構要加大數據處理分析專業人才隊伍的培養，同時要引進大數據處理的專業方法和工具，建立前瞻性的征信業務分析模型，更好的把握、預測市場和信息主體的行為。

(四)健全大數據信息共享機制。完善的大數據標準體系是推進數據共建共享的前提。目前，我國來自各行業、各渠道的數據標準存在差異，成為阻礙數據開放和共享的關鍵瓶頸。建議盡快統一標準和格式，以便進行規范化的數據融合，提升大數據的整合能力，打破資源部門間的信息孤島，從而完善信息共享機制。

第6篇

一、對稅務數據深度利用的理解

長期以來，稅收工作中數據利用比較常見的形式有：報表瀏覽、簡單查詢、復雜查詢、稅源分析、稅負分析、收入預測、過程監控等，多數專家認為，目前稅務數據應用的一般特征是基于匯總、分類、簡單計算基礎之上的原始稅收數據的“復制式”展現和對稅收現象的“陳列式”描述。

隨著經濟、社會的發展，稅收數據的般利用已經不能滿足稅收信息化深化和稅收管理現代化的內在需求，為了加強稅收征管、規范稅收秩序，國務院于1994年開始實施“金稅工程”。“金稅工程”初期以“增值稅監管”為主要目標；二期時，內容已拓寬為增值稅防偽稅控開票系統、防偽稅控認證系統、增值稅計算機交叉稽核系統、發票協查信息管理系統的四個系統；到了三期，其目標已經成為：在二期基礎上，建立七個子系統(管理子系統、征收子系統、稽查子系統、處罰子系統、執行子系統、救濟子系統、監控子系統)，35個模塊。依據美國學者Richard．L-Nolan的理論(對于任何行業，信息化大體要經歷初始、蔓延、控制、集成、數據管理和成熟這樣幾個發展階段，這是信息化發展的般規律。)和Mische的補充(他認為集成和數據管理是密不可分的，因此信息化發展的必然路徑是起步、增長、成熟和更新四個階段)，目前，稅務信息化的發展階段已開始向成熟階段過渡。于是稅收數據的深度利用便提上日程。我們可以從稅收管理戰略和稅收政策分析兩方面來看這種需求的提出。

從稅務管理戰略來看，在納稅前如何綜合評價簡化管理制度(法律)及照章納稅宣傳的相對效果；在納稅中如何核算稅收結構和管理程度的實際資源成本(管理、照章納稅、效率、逃稅)，以及納稅后對稅收差距的衡量(包括潛在稅收與申報稅收的差距、申報稅收與實收稅收的差距、實收稅收與送達國庫稅收的差距)，都涉及到稅收數據的深度利用問題。

從稅收政策分析的角度來看，稅收經濟的和諧發展度量、稅制改革方案分析、稅收減免和優惠的成本和政策收益、稅收政策的經濟影響等等也涉及到稅收數據的深度利用和挖掘問題。

這些問題都從以下兩方面引發了我們對稅務數據深度利用的理解和思考：一方面提出了我們需要全面檢視擁有的稅務數據信息的需求。在各國稅務數據信息深度利用的經驗當中，提出過一些全面檢視的標準，例如按照稅基到稅收收入的實現途徑，可以檢視：稅基的規模，包括真實稅基和潛在稅基；稅收管理資源使用方向的詳細分類；管理資源使用的效用；稅收管理的效果，例如收到稅款的多少，處理案件的數量等。

另一方面，更為關鍵的是，提出了如何科學利用、深度利用的問題。總結以上兩方面，我們認為稅收數據的深度利用是指：在數據集中和系統整合的基礎上，建立全面的稅務數據信息，既包括稅務系統內部數據，也包括其他政府部門、企業、居民等外部數據，并且進一步在各種模型的幫助下，發現數據的內在規律。就目前而言，重點任務是在稅務管理方面提出適用中國實踐的模型并且應用，同時初步探索在稅收經濟方面能夠刻畫符合我國國情的模型。

二、構建模型是數據深度利用的切入口

如前所述，稅務數據深度利用和挖掘的關鍵在于模型的應用，下面我們就來討論模型是什么?我們為什么需要模型?我們需要什么樣的模型?就稅收數據深度利用的模型而言，大致可以分為兩類：以科學化管理、定量化管理、精細化管理為內在思想的管理工具和手段所形成的模型；以研究稅收經濟關系協調發展為目的的稅收經濟模型。

在基本認識了稅務數據深度利用中的模型是什么之后，雖然我們達成了一種共識，我們需要模型，但是如果我們思考過為什么需要模型?顯然會對模型應用更能得心應手。我們認為模型所發揮的作用無外乎以下三種：

首先，刻畫稅收經濟關系。一般而言，我們經常提到的是模型在刻畫稅收經濟關系當中所起的作用，即采用代數形式的定量分析將稅收經濟理論模型化，然后適當根據實踐情況把理論模型予以修正，并將相關數據應用到修正模型中，對模型結果進行經驗分析。這種利用的過程是階段性的，是從初級到高級的過程，是一個水平不斷提高、效果不斷改進的發展過程。

其次，歸納稅收管理實踐。模型起到的作用是將復雜的稅收征納活動通過數字化的形式總結歸納，將稅收征納的每一個過程精細化、每一個結果數據化，并且建立起投入到產出之間的對應關系。最后，數據組織的導向性作用。這種導向性作用的發揮是通過模型應用過程當中對各類數據提出的要求實現的，通過該作用，隨著時間的發展，數據集中的有效性與目的性不斷加強，反之，模型應用空間不斷擴展。在這一方面，美國個人所得稅模型應用為我們提供了很好的啟迪。

結合目前的稅務數據基礎及其發展趨勢來看，金稅三期將成為稅收數據深度利用的良好契機，構建相應模型是我們形成稅務數據深度利用良好局面的切入口。

對于“我們需要什么樣的模型”的回答，是一個不斷結合實際進行摸索的過程，但是就現階段而言，從可操作性的角度出發，我們還是需要給所應用的模型框定一個邊界：數據可利用性，如果沒有數據的支持，模型應用將無從談起；可計算性，模型應用迅速發展的基石之一就是現代計算技術的發展，沒有計算工具的支持，具有龐大計算量的各種稅收模型的完成無法想象，支持稅收模型應用的計算工具包括硬件具備的計算能力和軟件具有的算法能力兩種。

三、數據深度利用平臺建設的體厶

數據深度利用和挖掘最終必須落實到具體計算平臺上，否則縱然有大量的數據積累，仍然擺脫不了研究與實踐部門脫節的窘態。雖然目前我們擁有大量的計算軟件平臺，然而，總感覺到這些應用平臺離我們的實際需要有一定距離。

目前我們正在參與完成一個國家自然科學基金研究項目：稅收政策分析模型支持系統的實現及其在稅制改革中的應用研究，其主要內容和實質就是探索構建一個有利干數據深度利用的計算平臺。從該平臺的構建來看，有幾點體會：首先，平臺的構建必須結合具體的研究問題展開。通用性的平臺雖然很好，但是由于前面所提到的數據可利用性和可計算性的原因，加上實際工作的緊迫性需求，往往使得通用性平臺的規劃會落空，甚至于進一步影響數據深度利用工作本身。在該問題上，我們的平臺研究就結合了增值稅轉型的測算問題，利用了CGE平臺進行實證性的應用。

其次，考慮針對具體問題研究的通用性拓展。雖然實用為先，然而要做到持續性的數據利用，必然要考慮拓展的問題。在這個問題上，我們的平臺通過稅制表示方法、稅收政策分析模型描述語言中國稅收政策分析模型支持系統等方法進行嘗試。

更為重要的是，對適合中國國情的稅收經濟模型的提出。由于長期以來的數據缺少原因，在我國模型建設方面沒有進一步的探索。這種缺陷在海量的數據突然呈現在我們面前的時候更加突出。我們正在嘗試提出適用干中國的稅收經濟模型，雖然肯定會比較艱難，但是這是一條必經之路。

第7篇

當前“大數據技術”充滿了新的機遇和挑戰，其在企業IT基礎架構、數據管理、分析和服務這些關鍵規劃領域的應用，將會對社會經濟發展帶來長遠深刻的影響。大數據指的是從各種各樣的數據中快速獲得有價值信息的能力，具有數據量大、種類繁多、價值稀疏、處理速度快的特征，這些特征對目前社會各個行業的信息架構、系統的沖擊非常大。大數據技術對整個社會經濟發展來說既是機遇也是挑戰。

（一）必要性

根據IDC在2011年6月的《數字宇宙》（DigitalUniverse）研究報告，2011年全球新建和復制的信息量超過1.9ZB（1.8萬億GB），五年時間增加了近九倍。隨著數據量的指數級增長、數據源種類（包括結構化數據源和非結構化數據源，如社交媒體、富媒體文件以及地理空間信息）的飛速增加，以及數據產生速度的加快（如實時傳感器數據），傳統的數據庫和架構無法處理、管理和分析如此龐大的數據集。政府、金融、電信、互聯網等大數據應用的行業先鋒目前均面臨大數據的問題。不僅如此，隨著物聯網、云計算、移動互聯網、車聯網、智能手機、平板電腦的飛速發展，大數據技術擁有了更為廣泛的數據資源。因此，IT產業界及行業用戶都亟需針對大數據設計和優化大數據存儲、管理和查詢平臺，來替代傳統關系型數據庫平臺。在技術發展的前沿階段進行實驗平臺建設對我學院師生具有重要意義。該實驗平臺能夠為學生提供一個了解最前沿技術的機會，不僅能夠提高學生學習興趣、自學能力，還為學生就業、更好地規劃未來的職業發展提供了機會。大數據技術的機遇與挑戰帶來了很大的人才缺口，目前大數據技術平臺開發、方案實施人才緊缺；由于云存儲、大數據技術帶來的信息安全問題，也亟需大量信息安全領域的人才；由于大數據技術在物聯網、電子商務、移動互聯方面的應用，對了解大數據技術的電子商務專業人才也更青睞。通過本實驗平臺的培養，感興趣的優秀學生還可以嘗試考取與大數據技術密切相關的Hadoop專業認證———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop，為學校、學院在該領域帶來正面影響，增加更多合作和就業的機會。該實驗平臺能夠為信息系統專業試點班培養計劃的很多核心課程（包括管理統計學中的業務報表與分析、商務智能方法與應用、商務智能實踐、數據挖掘和BA綜合實訓等）形成較好的前后銜接關系，能夠豐富實踐教學環節，深化教學大綱的內容，從建設更合理的課程建設體系來說具有很大的必要性。近幾年學生就業壓力越來越大，迫切需要對教學內容和實踐環節不斷突破創新，才能具備持續發展能力。因此在原有課程體系和實踐教學環境的基礎上增設本實驗平臺非常必要。

（二）可行性

教學計劃中的相關程序設計課程為學生學習云存儲技術、熟悉大數據開發平臺、了解最新大數據技術的發展、進行大數據平臺基礎上的開發、實現對大數據的分析、可視化演示打好了基礎。英特爾ApacheHadoop平臺是目前大多數大數據處理的技術基礎，目前該技術已經發展成熟，并隨之產生很多基于該平臺的大數據處理工具，可供實驗室建設實驗平臺使用。

二、建立大數據實驗平臺的基本構想

（一）實驗平臺人員

實驗平臺人員負責實驗平臺的建設、維護，實驗設計與指導人員由在大數據相關領域、課程建設以及實踐教學方面都有著豐富的經驗的教師與實驗室工作人員構成，同時與大數據企業進行合作，獲得其核心技術人員的支持、培訓和大力配合，可以共同組成一個經驗豐富、精煉實干的建設團隊。

（二）軟件調研

大數據的特點為4個“V”：第一，“Volume”，指的數據量大，包括大的數據塊，或數據總量巨大，從TB躍升到PB；第二，“Variety”，指的是數據種類繁多，包含大量非結構化數據，例如網絡日志、音頻、視頻、地理信息等；第三，“Value”，價值稀疏性，大量數據中有價值數據很少；第四，“Velocity”，指的是處理速度快，這與傳統數據挖掘有很大區別。選擇有數據分析基礎、在業內發展領先的企業進行調研并選擇適合高校規模的合作企業是建立實驗平臺的重要工作。很多公司給出了可供使用的大數據平臺：IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于開放源碼ApacheHadoop的分析平臺，用于分析大量本機格式的非常規數據，支持結構化、半結構化和非結構化內容，以實現最大程度的靈活性；IBM誖InfoSphere誖Streams是一個高級計算平臺，幫助用戶開發的應用程序快速攝取、分析和關聯來自數千個實時源的信息；惠普公司Vertica分析平臺6.1，能夠通過Hadoop分布式文件系統連接器來優化大數據；ClearStoryData大數據分析新創公司，通過Clearstory，公司客戶可以將自身的數據與行業的公共數據融合，尋找統計上的新視角，目標是取代目前市場上的主流數據可視化工具，包括QlikView和Tableau等老牌工具；Informatica9.1提供首款Hadoop編譯器Hparse，這是一種針對Hadoop而優化的數據轉換環境，該軟件支持靈活高效地處理Hadoop里面的任何文件格式，為Hadoop開發人員提供了即開即用的解析功能，以便處理復雜而多樣的數據源；Datameer：Hadoop海量數據分析平臺允許用戶在缺乏技術知識的情況下能夠分析大量數據；Infochimps平臺以其完備的基礎設施和專業知識，為客戶提供端到端的大數據解決方案，Infochimps是一家位于美國德克薩斯州奧斯丁的創業公司，2012年2月從數據市場轉型為大數據平臺提供商后獲得谷歌投資；甲骨文大數據機———OracleBigDataAppliance集成系統融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一個開源R；微軟SQLServer新增PDW功能，可以幫助客戶擴展部屬數百TB級別數據的分析解決方案；亞馬遜將MapReduce作為一項服務，其彈性MapReduce編程是一項能夠迅速擴展的Web服務，運行在aws的亞馬遜彈性計算云和亞馬遜簡單存儲服務上；Teradata是企業級數據倉庫（EDW）的領導者，在結構化數據、半結構化數據和大部分非結構化數據領域幾乎沒有很大成果，因此收購了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高級分析和管理各種非結構化數據領域的市場領導者和開拓者，為Teradata帶來了大數據分析市場商機。

（三）方案實施

實驗平臺的設計同時立足于大數據技術的發展的前沿性與本學院學生專業特點，與學生前序的理論、實踐課程均有良好的銜接，符合人才培養計劃，深化了教學大綱的內容，并針對不同專業學生設計實踐學時、內容和難度。本實驗平臺可以同大數據行業中的公司科研部門共同合作建設，雙方確定在人才培養、師資培訓、共建實驗室和實訓基地、推動大學生校外實習和社會實踐活動的開展等方面開展全面、廣泛、長期、深入的合作。該實驗室建設將豐富實踐教學體系，也可推動學院科研項目立項、新課題研究、專項基金申請和聯合開展商用項目開發等；該實驗室使師生能接觸高新大數據開發平臺，了解最新大數據技術的發展，進行大數據平臺的開發，實現對大數據的分析、可視化演示，增強學生的動手能力并提升就業質量；與此同時，提升了教師的項目管理能力和教學能力。

三、結論

第8篇

1 地方文獻報刊信息數據庫

地方文獻是指內容上具有地域性，同時具有重復使用價值的文獻。由于它完整、系統地記錄了特定地域內自然和人文方面的各種信息，從而為人們提供了研究特定地域內歷史、現代及未來的有關資料。

地方文獻的類型多種多樣，報刊文獻是其中的一種。它具有信息量大，傳遞周期短，內容相對客觀、翔實等特點。但由于它的總量太大，有關的地方文獻信息分散在不同時期、不同品種的報刊之中。僅靠瀏覽原始文獻，迅速查到有關資料，幾乎是不可能的。地方文獻報刊索引就是為解決這一問題而編制成的一種檢索工具。

在手工時代，地方文獻報刊索引表現為篇目索引或題錄索引的形式，即將報刊中所載地方文獻篇目按一定順序編排起來，以利讀者查找文章的所在位置。這種索引不反映文章的具體內容，只具有指向和示址作用。同時，也對地方事物起著揭示和報道的作用。除了作為一種綜合性的檢索工具外，還可以在這種索引的基礎上編制各種情報報導刊物，或圍繞特定學科及專業進行定向報導和檢索，以服務于地方的各項事業。

鑒于地方文獻報刊索引的重要作用，許多公共圖書館都曾積極編制這種索引。例如，首都圖書館自50年代起開始編制《北京地方文獻報刊資料索引》，涵蓋了本世紀以來的內容；甘肅省圖書館也是在同一時期開始編制西北五省的地方文獻報刊索引；長春市圖書館也曾編制了《東北地方文獻索引》等檢索工具。為了避免目錄體系過于龐大，這種卡片式篇目索引一般僅以分類方式編排。因此讀者也只能從分類途徑對報刊上的地方文獻信息進行檢索。進入計算機時代以來，以數據庫形式來處理地方文獻信息已成為圖書館地方文獻工作的必然趨勢。計算機所具有的自動識別與排序功能，使地方文獻信息的編排檢索變得更加方便、更加快捷。通過全文掃描技術完成的報刊全文數據庫，使得報刊上的地方文獻信息得到更充分地揭示和利用。由于計算機具有一次性輸入，多途徑輸出的功能，因而在對地方文獻信息進行存儲與檢索時，增加了篇名、著者、出版、文摘等多方面的途徑。尤其是從主題途徑檢索地方文獻信息的問題得到了很好地解決。

在地方文獻報刊信息數據庫（以下簡稱報刊信息庫）中，分類標引和主題標引都是以揭示文獻內在特征為目的的標引方法，只是揭示的角度有所不同。由于地方文獻的史料特征極為明顯，故地方文獻的讀者往往是從特定的事件、人物、時間、地域的角度入手進行檢索。因而可以說主題檢索是一種最直接反映地方文獻內容特征的檢索途徑，也是建立檢索工具和檢索系統的基礎和前提。近些年來，圖書情報界對有關主題標引的原則和操作方法有過許多研究和探討，撰寫過很多的著作和文章。但由于地方文獻中連續出版物本身所具有的特征，其主題標引的原則和方法與其它類型文獻的標引還是有所不同。本文擬從報刊信息數據庫的建設入手，探討有關地方文獻報刊信息主題標引的一些問題。

2 地方文獻報刊信息數據庫中的主題標引

2．1詞表的編制

報刊信息庫與其它類型數據庫相比，最突出的特點是要反映地方文獻本身所具有的特征。同時還要滿足地方文獻用戶特殊的檢索需求。因此，選擇一部適合地方文獻特征的主題詞表是開展標引工作的首要問題。

《漢語主題詞表》（以下簡稱漢表）是一部供機檢使用的綜合性基礎型詞表。它所收錄的詞匯可以供各個機構和行業從中選詞，以編制適合本專業或本機構使用的專業詞表。實際上，我國很多專業情報機構和圖書館都是在參考這部國家詞表的基礎上編制自己詞表的。在編表過程中，抽取主題詞時當盡可能不破壞原有詞表的詞間關系。但必要時，詞間關系及基本范疇還是需要重新確定的。

由于地方文獻是對某一地域自然和人文現象的客觀描述，它所表現出的地域性和專指性極強。用綜合性的《漢表》來標引各地的地方文獻，則將有相當部分的文獻不能被準確地表達其主題概念；其次，地方文獻的內容范疇與《漢表》中的基本范疇也有所不同。《漢表》是以學科體系作為劃分范疇的基本依據；而地方文獻則是以特定地方的自然環境、人文環境和地方事業作為劃分范疇的基本依據。所以地方文獻主題詞表需要在《漢語主題詞表》的基礎上自行編制。

地方文獻主題詞表中所收錄的主題詞來源主要有：

①《漢表》中已有的詞匯。這是地方文獻與非地方文獻都使用的綜合性詞匯，它占將來的地方文獻主題詞表所收詞匯的絕大部分。由于是從《漢表》中選詞，所以它們是相對規范的。

②《漢表》中沒有的，帶有地方特點的詞匯，如：北京地方文獻的“琉璃廠”、天津地方文獻中的“皇會”、廣東地方文獻中的“早茶”等，這部分詞匯雖然在未來的地方文獻主題詞表中所占比例不會很大，但它們卻是出現頻率相對較高的詞匯。對于這部分詞匯及其詞間關系，地方文獻工作者需要加以規范。

③《漢表》作為階段性產品，它的編制受時間的限制，對于編表以后新產生的一些詞匯它不可能收錄，在新編的地方文獻主題詞表中收錄這部分詞，也需要加以規范。

由于編制先組式的主題詞表需要一段相當長的時間，同時還要編制一系列的標引細則，這將會影響報刊信息庫主題標引工作的迅速展開。因此，可以采用另一種方式，即首先確定一段時間為試驗期，先進行地方文獻的標引工作。由標引人員直接從報刊所載的地方文獻信息內容中選取有檢索意義的關鍵詞作為主題詞。這種主題詞是未經規范的自然語言，也無詞間關系可言，待積累了一定數量之后，再對其進行修改、充實，并參照《漢表》使之規范化。確定好詞間關系和基本范疇，從而形成適用的詞表。這種詞表是后控式的，采用這種方式選詞更直觀，專指性強，還能使標引工作與修改詞表同時進行。而且標引時不用考慮詞間關系及查表抽詞，所以標引速度快。在標引時采用自然語言，對標引人員的要求也相對較低。目前，廣東省中山圖書館的地方文獻數據庫系統主題標引就采用了這種方法。

2．2主題詞字段的設置

無論是先有詞表，還是先進行標引工作，在報刊信息庫中，都需要設置若干個主題詞字段，以便展開具體的標引工作。在設置主題詞字段時，一定要注意反映地方文獻的時空特征；在空間方面完整、系統地記錄特定地域內自然和人文方面的各種信息；在時間上又形成了一個連續的信息集合。這是一切地方文獻工作最基本的原則。

在報刊信息庫中，首先應設置涉及文獻基本內容的“內容主題詞”字段。此字段選詞靈活性大，標引的內容也十分廣泛。它對所有地方文獻信息的內容范疇進行涵蓋，也是以后編制地方文獻主題詞表時確定詞表基本范疇的依據。從地方文獻的性質和特征來看，它是對特定地區自然、社會、人文諸般事物的歷史與現狀進行全面系統地綜合性記錄，涉及的內容極為廣泛。如反映一個地區所能觀察到的天文現象、地質水文結構、地形地貌、氣候與氣象、物種與資源以及反映該地區的人文地理、歷史、地方人物、社會經濟、地方政治、社會結構、地方文化、教育等各個方面。

報刊信息庫中“內容主題詞”字段的主題詞性質絕大部分是綜合性的，與其它非地方文獻數據庫中的主題詞無太大區別。例如“社會治安”，“計量管理”、“住宅區”、“軟件產業”等；也有一部分是地方文獻內容所特有的地方性詞匯，如“敦煌石窟”、“庚子”、“廠甸”等；另外，新產生的一些地方文獻信息的內容，也應通過內容主題詞來表達。總之，凡是涉及到地方文獻的所有內容特征，都應在此字段予以反映。

這一字段并非地方文獻數據庫所特有，有關具體標引方法的討論從略。

另一種主題字段的設置應反映地方文獻內容特征以外的其它特征。地方文獻最大的特點，就在于文獻所記載的現象、事實和人物都被限定在某一特指的時空范圍內。也就是說。地方文獻所涉及的內容范疇均會通過特定的時間、地點、團體機構、人物等因素反映和輸出。地方文獻用戶的檢索習慣也往往是從某一地域范疇、地區名稱、某一事件、某一人物入手。因此，有必要在地方題錄庫中設置“地域主題詞”、“時間主題詞”、“團體主題詞”和“個人主題詞”諸字段。它們是揭示地方文獻的本質特征所必須的字段。同時也是地方文獻數據庫系統中所特有的。

以上四個主題詞字段所反映的是有關地方文獻信息中客觀存在的某些因素，如“地域主題詞”中的“東城區”、“梅山縣”、“個人主題詞”中的“梅蘭芳”、“秋瑾”等。盡管這四種主題詞的標引與“內容主題詞”的標引相比，相對容易些，但仍需積累到一定數量后進行規范。例如“團體主題詞”中的機構名稱是用全稱還是用簡稱，以及“個人主題詞”中的人物名稱是用本名還是用筆名，這些都需要地方文獻工作者在以后的工作中根據本地區的具體情況加以規范。

具體的標引方法是：

地域主題所標引的不是整體地方文獻的地域，而是文章內容涉及的某一具體區域的名稱，或者給文章內容帶來影響的區域名稱。如有關北京地方文獻的內容不用標“北京”，直接標引具體的“東城區”、“昌平縣”等行政區劃名稱；內容涉及到較具體的地名時也可標引地名，例如“王府井大街”、“方家胡同”等；如果文章中所反映的地區更詳細，區（縣）、街道（鄉鎮）、村等具體名稱都有，可逐級進行標引，中間用分隔符隔開，如北京地方文獻中的“順義縣%趙全營鎮%北郎中村”；在標引中，遇到舊有的行政區劃名稱或舊地名時，為反映某一地區名稱的歷史發展沿革，應將現行行政區劃名稱與舊有行政區劃名稱同時標引作為檢索點，現有行政區劃名稱或新地名標在前面，舊行政區劃名稱或舊地名注于其后，可用括號括起。如“東城區（內三區）”。以上的標引方法主要是針對地方文獻用戶特定的檢索需求而言。

年代主題標引的是文獻內容所涉及的時間范圍，而不是文獻撰寫或出版發行的時間。清以前的歷朝歷代均可使用“朝代%年號”的方法標引．如“清代%乾隆”，中華民國時期（1919年前）可標引成“民國時期”，到了1920年以后可以標引成“二十年代”、“六十年代”等。

團體主題和個人主題標引的是文章內容所涉及到某一具體機構、個人，或與某地方有關系的機構和個人。團體主題標引時，用機構和單位的標準全稱，如“北京市中級人民法院”、“重慶市技術監督局”等；而個人主題的標引，是標具體人名，例如“梅蘭芳”；如果遇到同一人物有本名與筆名時，要同時標引，如“魯迅”與“周樹人”、“老舍”與“舒舍予”之間可用符號“%”隔開；遇到清代人物或少數民族人物的名稱較長時，一般應標引人物的全名，如“愛新覺羅·溥儀”。

總之，無論標引什么類型的主題詞，標引人員都要站在用戶的角度，即從索引的終極使用目的出發，給地方文獻實際使用者提供有價值的地方文獻信息。因此，在對報刊信息庫進行主題標引過程中一定要確定好標引深度。地方文獻報刊索引的標引深度，則取決于地方文獻各類用戶的檢索需求。地方文獻的研究級用戶的檢索需求包括：決策、管理人員宏觀的檢索需求、科研人員較專深的檢索需求及設計生產人員的針對性檢索需求等。

盡管采用數據庫系統處理地方文獻信息這一手段在全國各類圖書館的地方文獻業務中開展得還不夠普遍，但這是地方文獻工作發展的必然趨勢。結合地方文獻本身的特點來制訂適用的主題詞表、分類表，是實現地方文獻信息處理標準化的必要步驟。它可為今后進行聯機檢索，進入國家和地區網絡，從而實現地方文獻資源共享打下堅實的基礎。同時，計算機多途徑檢索所產生的效果也會使地方文獻信息資源得以更充分地研究與利用。

參考文獻

1 韓樸.圖書館地方文獻工作.北京：文津出版社，1992

2 中國科學技術情報研究所.北京圖書館.漢語主題詞表.北京：科學技術文獻出版社，1979

優秀范文

相關期刊

五十路熟女俱乐部,韩国非常大度的电影原声,久久久久久人妻一区二区三区,精品久久久久久综合日本

數據信息論文賞析八篇

第1篇

第2篇

第3篇

第4篇

第5篇

第6篇

第7篇

第8篇

數據

大數據

大數據時代

數據法學