發布時間:2023-06-04 09:45:26
序言:寫作是分享個人見解和探索未知領域的橋梁,我們為您精選了8篇的數據分析的前景樣本,期待這些樣本能夠為您提供豐富的參考和啟發,請盡情閱讀。
關 鍵 詞 數據庫;信息資源;信息管理系統;企業發展
中圖分類號:F293 文獻標識碼:A 文章編號:1671—7597(2013)031-068-01
數據庫是長期存儲在計算機內有組織的大量的共享的數據信息的集合,是按照一定的數據結構來組織、存儲和管理數據信息的倉庫。信息資源是企業在生產和管理過程中產生的一切資料、數據和圖片等信息的總稱。信息管理系統是指能提供企業管理所需的信息的人機交互系統。
1 數據庫的結構與特點
1)數據庫主要有三層基本結構:①物理數據層。即數據存儲層,它是指在物理存貯設備上實際存儲的數據,是最原始的數據,是用戶需要加工的數據;②概念數據層。它是數據庫管理員概念下的數據庫,定義了每個數據的邏輯及數據間的邏輯聯系;③邏輯數據層。即用戶層,它是用戶所看到和使用的數據庫。
2)數據庫主要有七個特點:①數據的共享性。即所有用戶可可通過各種方式同時使用數據庫進行數據存取,數據庫也包含所有用戶所需求的數據,從而實現了數據的共享;②數據的簡潔性。數據共享的實現減少了文件系統中所必需的建立用戶各自的應用文件,從而減少了數據的大量重復和冗余度;③數據的一致性。數據的共享也保證了數據的一致性;④數據的集中控制性。數據庫避免了文件管理方式中的分散狀態,對數據進行集中控制和管理,便于對數據丟失或泄露的及時處理;⑤數據的獨立性。即數據庫中的邏輯結構和應用程序相互獨立和數據物理結構和數據邏輯結構相互獨立;⑥數據的安全性。防止數據丟失、錯誤更新和越權使用;⑦數據的可建設性。數據庫功能強大,技術可升級,有良好的可建設性。
2 數據庫在企業中的發展現狀
1)企業對數據庫的重視度不夠。企業對數據庫的發展建立不夠重視,目前文件系統和文件管理還是企業信息管理的主要途徑,企業沒有將數據庫當做一個企業的重要產業來建設,沒有主要的職能部門對數據庫進行管理和建設,投入的人力物力少,投入的資金也不夠,導致了企業數據的丟失,企業信息資源供應不及時,企業內部能共享的信息重復占用資源等問題,造成了企業的巨大經濟損失。很多企業只著重于眼前的利益,沒有長遠的經濟目光,對數據庫的開發建設程度不高。要想讓一個企業能長遠的立足和發展,就必須加大對數據庫和信息管理的開發力度。
2)企業對數據庫的認識不夠。數據庫的建設和信息管理系統的開發,不僅是為了科研部門的相關研究工作,同時也是為經濟、銷售、政治等其他部門提供可靠的信息資源的保證。數據庫對企業信息資源的管理功能強大,在數據庫中集中控制企業各個部門的數據,能快速地查找到數據的根源,能及時地處理數據的遺失和泄露。
3)企業對數據庫的建設水平低。數據庫技術在企業中的開發還處于初級階段,企業并沒有完全成熟的和完善的數據庫下的信息管理系統。不夠成熟的計算機開發技術也還跟不上數據庫建設的需要和社會的需求。不夠完整的數據庫體系結構,不夠成熟的數據庫開發技術,不夠充足的認識和不夠重視的發展等,這些都是數據庫在企業中的發展駐足不前的原因。
就現階段而言,還是有相當一部分的企業擁有了相對比較完善的數據庫技術和信息管理系統。企業要長足發展,信息的數量和管理力度必將加大,能解決這一系列信息相關問題的數據庫技術就是瑰寶了。因此,加大加快發展企業中的數據庫技術是想要長足發展和生存的企業現階段的主要任務之一。
3 數據庫在企業中的發展前景
1)企業對數據庫的需求增加。隨著企業發展的逐步壯大,企業信息資源也將更加復雜,信息數據量更大。傳統的文件系統和文件管理已經遠遠無法滿足企業現代化的需求。數據庫在企業中的發展意味著數據處理和信息資源管理的高效率,對企業來說,更高的效率意味著更大的利益和更廣的競爭空間。
2)企業對數據庫的技術要求加大。數據庫在企業中的開發和建設技術不夠完善,但同時也有了更大的發展空間。飛速發展的企業對數據庫技術要求越來越高,這是數據庫技術的機遇,也是企業的機遇。因此,努力開發企業數據庫技術和建設信息管理系統是企業發展的必備籌碼。
3)知識產權對數據庫的保護。信息的高速發展讓信息逐步成為了一項產業,信息也作為商品進行交易,《知識產權協定》對數據庫和信息資源進行保護,抑制了企業間的不正當競爭行為。安全的外部環境為數據庫在企業中的發展提供了良好的平臺。
4 結束語
數據庫在企業中的發展就像新長的嫩葉,沒有很完善的體系結構和技術,沒有得到很大的關注和重視,但是它卻有更廣闊的發展空間,更大的需求量,安全的環境也是它將迅速發展的有利條件之一。由數據庫技術實現的信息管理系統已經成為企業發展的重要保障,是企業信息化發展和企業競爭的必備條件之一。一個企業要想快速健康的發展,就必須發展自己的數據庫技術和信息管理系統。為了迎接二十一世紀新挑戰,在繼承傳統企業信息資源管理的優勢下,結合新興的數據庫技術和計算機科學技術,努力實現、提高和改善對數據及信息資源的使用。
參考文獻
[1]黃欣.數據庫在企業中的發展現狀及前景分析[J].信息與電腦(理論版),2006(2).
【關鍵詞】胃鏡檢查;焦慮恐懼情緒;原因分析;護理對策
隨著我國人口不斷向老齡化方向發展,需要接受胃腸鏡檢查的人越來越多,受檢病人的條件限制日漸放寬。電子胃鏡檢查是診斷胃病最直觀的檢查方法,也是目前診斷食管、胃和十二指腸疾病最為可靠的方法。胃鏡檢查具有一定的痛苦,而且麻醉具有一定的風險,患者易產生焦慮恐懼情緒[1]。這種不良情緒嚴重影響了胃鏡檢查術的成功率,因此分析患者恐懼焦慮產生的原因并給予相應的對策細致護理是十分必要的。本文分析了2012年6月――2013年6月間為110例患者胃鏡檢查術患者焦慮恐懼產生原因,并給予針對性的護理措施,患者焦慮恐懼情緒明顯緩解,效果良好,現作如下報告。
1資料與方法
1.1一般資料選擇2012年6月――2013年6月我院收治具有不同程度的消化道癥狀、需要胃鏡檢查的患者110例為研究對象,其中男性患者57例,女性患者53例。年齡分布在15-87歲(35.26±6.25)歲,110例均無胃鏡禁忌證。
1.2調查方法采用自擬調查問卷調查表分析患者的基本情況,內容包括性別、年齡、教育程度、家庭狀況、經濟條件、家庭支持、疾病認知程度、胃鏡檢查知識、可能出現的并發癥、費用支付方式、護理質量;采用SAS自評量表[2]評估患者焦慮情緒,分1、2、3、4四個等級,分別賦分4、3、2、1分,分值越高,各項分相加后乘以1.25取整數為標準分,分值越高,焦慮程度越厲害。
指定專職調查者對已簽署胃鏡檢查知情同意書的患者進行了調查,年齡小的患者由家長替代調查。
1.3數據處理所有資料經確認有效后存入Execl數據庫,采用SPSS13.0軟件對數據進行統計分析,計數資料用頻數(n)或率(%)表示,采用卡方檢驗,檢驗標準:P
2結果
通過對SAS數據分析,SAS平均分>50分的為67分,表明110名胃鏡檢查術前患者中有67名患者均有焦慮恐懼情緒,仔細分析67名患者在性別、文化程度、經濟狀況、付費方式、疾病認知程度、胃鏡檢查知識、社會家庭支持滿意度、護理干預質量滿意度方面差異,表明:女性、高中(含中專)、家庭人均月收入
3討論
3.1焦慮恐懼情緒原因分析胃鏡檢查是一種刺激性檢查,能夠引起人體不同的應激反應,包括生理上的應激反應和心理上的應激反應,生理上主要表現為惡心、嘔吐、血壓及脈搏的變化,心理上表現出情緒焦慮、恐懼等,兩種反應相互作用,又增加了復合應激反應[3]。本文研究表明,女性(69.81%)所表現出的焦慮恐懼情緒明顯高于男性(52.63%),這可以從男女承受應激反應方面得到解釋。
進一步分析可以看出,不同文化程度、不同經濟狀況、不同付費方式的人群胃鏡檢查前所表現出的焦慮恐懼程度也不相同,初中文化以下文化程度與大專以上文化程度明顯低于高中(含中專)文化程度,家庭人均月經濟收入>3000明顯低于3000以下的人群,自費人群明顯高于公費及醫院保險受益人群。比較分析好像有些矛盾,可能與初中以下文化程度大多生活在社會底層,抗擊打能力較強有差。
從對疾病知識的認識程度、對胃鏡檢查及可能誘發并發癥的了解程度、社會家庭支持滿意度、護理質量滿意度分析,可以看出了解得越深入、滿意度越高,患者產生焦慮恐懼情緒的比例就會越低,國外學者從不同的角度研究的觀點都支持這個結論[4-5]。
3.2護理對策構建全方位的社會家庭支持網絡:胃鏡檢查患者因角色的轉換,急需社會家庭的關心支持。護理人員要反復向家屬宣講家屬陪伴對患者病情康復的作用,同時對于多次胃鏡檢查沒有確診的患者,要盡可能地滿足患者家屬陪檢的要求。對于自費的患者,要注意溝通的方式方法,避免方法失當可加重患者焦慮恐懼情緒[6]。
加強健康宣教,提高患者對疾病與胃鏡檢查的認知水平。可采取發放宣傳小手冊、播放資料、或者是一對一個案教育等形式,告知胃鏡檢查的過程、方法、可能發生的不良反應,以期讓患者獲得更多的認知,從而減輕或消除焦慮恐懼情緒,增強治療的依從性。
提高護理質量,增強服務意識。本文研究表明患者的焦慮恐懼情緒與患者對護理質量的滿意度呈正相關性,這與有些研究不盡相同,但可以肯定的是,護理質量的優劣、服務態度的好壞對患者心理是有影響的[7]。因此護理人員要熟悉胃鏡檢查護理流程,主動熱情微笑服務,以構建良好的護患關系。
綜上所述,胃鏡檢查術前患者產生焦慮原因影響因素很多,性別、文化程度、經濟狀況、付費方式、對疾病的認識程度、對胃鏡檢查及可能產生并發癥的了解程度、對社會家庭支持及護理質量的滿意度均可對術前檢查焦慮恐懼情緒產生影響。護理人員應分析原因,構建全方位的社會家庭支持網絡,加強健康宣教,提高患者對疾病與胃鏡檢查的認知水平,提高護理質量,增強服務意識,從而達到有效化解或減輕患者焦慮恐懼情緒的目的。
參考文獻
[1]姚菊英,高春紅.膝關節鏡手術病人的康復護理[J].護理學雜志,2002,17(2):150-151.
[2]汪向東,王希林,馬弘.心理衛生評定量表手冊[J].中國心理衛生雜志,1999,12(增刊):253-256.
[3]滕云.胃鏡檢查前患者焦慮的護理體會[J].中國醫藥指南,2012,10(28):301-302.
[4]張凌燕,王艷玲.初次胃鏡與多次胃鏡檢查患者焦慮狀況分析[J].中華現代護理雜志,2009,15(7):630-631.
[5]Zaman A,Hahn M,Hapke R,et al.A randomized trial of perorlavesus transnasal unsedated endoscopy using an ultrathim videoenodscope[J].Gastrointest Endosc,1999,49:279-84.
關鍵詞:大數據分析 新聞深化報道 應用研究
大數據分析如今已經觸及到了社會生活的各個領域,近些年來的全國兩會就是典型代表,新聞報道中應用大數據分析,使得新聞報道更加具有說服力。通過大數據分析,新聞報道能夠挖掘潛在新聞元素,發現新聞事件中的邏輯規律,從而豐富新聞報道的內涵,讀者也能夠對新聞事件作出更加理性的判斷。可是,大數據分析究竟是什么?大數據分析在深化新聞報道中又是如何體現的呢?筆者將對有關內容作進一步研究。
一、大數據的基本概念
最早提出“大數據時代”概念的是美國的麥肯錫公司,在對大數據進行定義的時候,麥肯錫研究所是這樣理解的:大數據是相對于傳統數據而言的一個概念,指的是依靠傳統的數據庫軟件或者工具難以抓取、存儲、管理和分析的數據群。與麥肯錫研究所不同的是,百度百科給大數據下定義的時候是這樣描述的:大數據又稱為巨量資料,由于大數據涵蓋的資料規模龐大,利用當前主流的數據軟件或者工具在一定的時間內無法達到擷取、管理、處理并整理成為更加積極的幫助企業或者組織進行經營管理決策的資訊。無論是何種定義,都認為大數據已經超出了傳統的數據庫軟件或者工具的能力范圍,大數據具有大量、高速、多樣、價值高等特點。
二、大數據分析在深化新聞報道中的應用
(一)尋找準確的切入角度
大數據分析應用在新聞報道中,能夠幫助新聞工作者找準新聞事件的切入點。新聞行業是數據的重要應用者,通過數據分析,能夠將原本分散、瑣碎的數據呈現出一定的邏輯規律,使得新聞報道的切入點更好把握,從而讓新聞工作者能夠對新聞熱點進行深度解讀。比如,在報道全國兩會的時候,很多老百姓關心的問題,如果通過大量的文字進行描述,可能會讓老百姓感覺過于形式化,新聞報道中通過大數據分析,切入點找準之后,能夠和老百姓產生共鳴,引起的社會關注度也更高。
(二)加強新聞報道的深度
以往,新聞工作者在進行新聞報道的時候,要想獲得相關的數據只能夠通過電話聯系的方式經過有關部門的同意之后才能夠實現,整個程序下來非常繁瑣,并且獲取的數據并不一定能夠真實反映數據背后的意義。但是,和以往大不相同的是,網絡的存在使得世界各國的數據觸手可及,新聞報道中大數據分析的應用,可以最大限度地提升新聞報道的深度。例如,前些年有一則科技類的新聞,標題是“聯想超越惠普,成為全球第一大個人電腦廠商”。面對這樣一則新聞,為了能夠讓讀者更加信服,彭博新聞社應用大數據分析進行了深度剖析,以2004年聯想和IBM簽訂合同作為起點,對比分析了世界范圍內的五大個人電腦生產商的股價變化,其中就利用到了大數據,通過數據對比,有力地說明了聯想這在八年內市場份額的不斷擴大,從而實現了對惠普的趕超。新聞中的大量數字的出現,很好的解決了質疑者的疑問,而這樣一個實例也恰恰顯示了大數據分析應用在新聞報道中能夠使得報道更具深度。
(三)創新新聞報道視角
大數據分析應用在新聞報道中能夠給新聞報道提供更具特色的報道視角。曾經在《兩會大數據》節目中有人提出過這樣一個問題:中國“兩會”的召開,在哪個國家的關注度更高?以往,面對這樣一個問題很難解答,即使能夠作出回應也只能通過諸如《全球高度關注中國兩會》這樣的報道中尋找答案,而這樣的答案通常都是含糊不清的。然而,借助《兩會大數據》欄目,能夠合理地對全球其他國家對“兩會”的關注度進行排名,得出的結果將會更加具有說服力。通過對全球將近90個國家的網民對“兩會”新聞的瀏覽、評論的數據,經過數據分析,可以客觀公正地顯示出關注“兩會”的熱點區域,使得國人對國外民眾如何看待“兩會”的問題的答案從模糊變得明確,而這都是利用大數據分析實現的。
(四)s短報道響應的時間
大數據時代,新聞工作者能夠更加快速地收集數據、分析數據、選取數據,然后形成相應的新聞報道,為受眾提供及時的新聞資訊。不管是關系百姓日常出行的天氣預報,還是各種網絡熱點新聞,大數據分析的應用,可以在最短的時間內對問題進行解讀分析,受眾可以不出家門就能夠及時了解到世界各地的新聞資訊,大數據極大地縮短了新聞報道響應的時間。新聞報道具有客觀性,也具有時效性,對于新聞工作者而言,如何第一時間將新聞報道出來以此吸引更多讀者前來閱讀是他們每天必須考慮的事情。大數據分析的應用,采用最新技術和方法來加速相應的時間,這樣就使得掌握大數據分析報道方法的機構能夠掌握最佳的報道實際,不但節約了大量成本,還獲取了海量的關注,新聞報道的實效性更強,新聞事業的發展也將更進一步。
三、結語
網絡時代背景下,我們不可避免地將同各式各樣的數據產生接觸,大數據不但改變了我們的思維方式,還該變了我們的生產方式,更加改變了我們的生活方式。大數據分析的應用,使得新聞報道更加具有深度的同時,它的時效性也大大增強。期待在大數據背景下,新聞報道能夠借助大數據分析實現更好的發展。
參考文獻:
[1]程潔.大數據分析在深化新聞報道中的應用[J].新聞愛好者,2014,(07).
[2]胡艷.數據可視化在新聞報道中的應用前景探析[J].西南民族大學學報(自然科學版),2014,(05).
關鍵詞:組合預測方法 旅游經濟 數據分析預測
現階段,國家對旅游行業的投資顯著增加,旅游經濟成份發展也呈現出多元化趨勢,投資格局也漸趨多元,旅游業“政府主導、社會參與、市場運作”的發展模式發展應用也漸趨成熟。但是旅游行業的發展過程中面臨著環境、經濟政策等各項影響因素,需要構建有效的發展模式,全面提升經濟發展科學化與系統化水平。本文著重分析了組合預測方法在旅游經濟分析預測中的創新應用。
一、旅游經濟發展現狀概述
近年來,我國旅游行業的發展呈現出資源特色化與旅游需求多元化的特點,基于此發展趨勢,國家注重進行了特色化、綜合化旅游資源開發,為旅游行業的發展注入了新生機。伴隨著旅游資源的開發,旅游經濟網絡不斷升級完善,但是有些地方的旅游經濟指標仍然存在不科學現象,還有些地方旅游經濟發展相關機制并不健全,直接影響了旅游經濟行業現狀分析與前景預測工作的開展,間接導致了旅游經濟目標的實現,嚴重不利于區域的協調發展。
此外,有些地方的旅游經濟發展進展方式不科學,主要表現在旅游資源的開發過程中忽視環境生態指標的落實,直接降低了地區旅游資源開發過程中生態效益的實現,由此可見,健全旅游行業的組合預算模式進行旅游經濟現狀分析與前景預測具有必要性與緊迫性。
二、組合模型研究與應用
現階段,旅游經濟行業預測方法多樣,但是受多種因素的影響,使用單一的經濟預測方式具有一定的局限性,旅游行業發展受多元化因素的影響,因此行業經濟預測方法應該囊括旅游行業多元因素的實際情況,并能進行綜合化的預測評估,并全面提升旅游行業經濟工作的科學化水平。基于這種方法需求,眾多學者主張將組合預測分析法應用于旅游經濟分析預測中,該方式采用模型預測模式能夠全面、系統的推進旅游經濟預測分析工作的進展。
(一)單項預測模型構建
現階段,旅游經濟行業分析預測工作中應用的模型主要有指數平滑模型、ADL回歸分布滯后模型及局部多項式估計模型三種,其中前兩種應用比較廣泛,并且模型構建過程中具有一定的技術要點。
1、指數平滑模型
指數平滑模型的構建是基于指數平滑法組建的模型,又叫作指數修勻,具有進行數據自動跟蹤的功用,因此在短期經濟趨勢預測方面應用廣泛。指數平滑模型應用于旅游經濟數據預測中能夠減弱數據過大波動,可以進行有效的短期趨勢預測。
指數平滑模型進行數據波動處理時會綜合應用各種方法,這樣能夠有效避免數據處理的滯后性,能及時捕捉到數據的動態更新,具有廣泛的應用價值。
2、ADL模型
ADL模型基于經濟預測理論與數據信息處理結合基礎,能夠處理變量數據并總結出變量中穩定關系的應用模型,該模型主要應用于經濟變量參數闡述,并進行數據統計與診斷檢驗,因此在旅游經濟參數確定中具有利用價值。但是該模型在應用中一旦丟失解釋變量將會直接導致模型應用偏差,因此要注意該模型應用中的解釋變量的保存。
此外,ADL模型應用中的參數估計是其重要環節。傳統的該模型應用中常考慮國際旅游外匯收入,現階段應用比較廣泛的模型將入境過夜旅游人數作為變量算入模型,有效提升了模型得出的回歸參數的有效性。而且新模型應用中還進行了模型檢驗與優化,尤其是進行了自相關性LM檢驗與Wald系數檢驗,全面減少了模型應用的約束因素。
(二)組合預測模型參數估計預測
組合預測法是綜合多種預測方法與模型設計進行經濟數據分析與預測的新型方法,主要分為線性組合預測與非線性組合預測兩種。組合預測法具有較高的預測精度。在預測實踐中,采用不同的預測方法會得出不同的數據結果,這與其中的參數估計與預測有關。
組合預測模型中的參數估計與預測環節中比較重要的是各單項預測中加權系數的選取,應用比較廣泛的是誤差平方和最小的方法。現階段,參數估計與預測中構建了誤差評價指標體系,其中著重就加權系數應用有效性規定了評價標準,并分七種情況進行了預測效果羅列,這樣應用該預測方法進行數據分析能夠較低風險性。
三、旅游經濟前景預測應用
將組合預測法應用于旅游經濟數據處理領域能夠有效強化旅游行業的數據統計,為旅游行業發展提供科學指導,尤其是應用于旅游經濟前景預測環節。
將組合預測法應用于旅游經濟數據分析預測中可以為經濟調控與經營方式的改進提供指導,因此該法在旅游經濟發展前景中應用將會越加廣泛。
四、結束語
本文著重分析了組合預測分析法在旅游經濟分析預測中的應用,筆者認為將該技術應用于旅游經濟分析中能夠進行經濟前景預測,其應用具有重大的戰略意義。強化組合預測模型構建,并精確模型參數,對于提升組合預測法應用價值意義重大。
參考文獻:
[1]雷可為,方田紅.基于組合模型的陜西省旅游市場需求預測[J].西北師范大學學報(自然科學版),2009(03)
云計算、大數據浪潮的一個表現是,IT市場從“以計算為中心”向“以數據為中心”轉變。以IDC的2012年第三季度市場分析數據為例,外部存儲市場增長3.3%,服務器市場卻下降4%。這是因為,云計算讓廉價的X86服務器可以擔當重任,“計算”的門檻便降低了。
“數據”方面的情況則是,數據量飛速增長。最近,IDC了2012數字宇宙研究報告,報告調高了對數字宇宙增長速度的預測。2010年,IDC預測到2020年,數字宇宙的規模為35ZB。在最新的報告中,這一數字變為40ZB。
2013年,我們還將看到,云計算、大數據浪潮正在引發IT廠商格局的巨變。思科公司董事長錢伯斯最近做出預言,微軟、IBM、惠普、SAP、甲骨文和思科等科技巨頭,5年內將有兩家或3家不在名單之列。同時,EMC、VMware進一步提出軟件定義數據中心的理念,將云計算的變革推向深入。
在IT產業中,EMC公司的規模并不算很大。2012年銷售收入預測為216億美元~217.5億美元,而它在IT業界的地位超過了很多規模大的公司。EMC之所以能夠引領云計算、大數據潮流,是因為公司決策層能夠敏銳地洞悉行業技術趨勢,從產品、技術和解決方案上提前布局。
最近,EMC公司全球11位高管從技術的角度,對2013年全球技術趨勢進行了預測。這11位高管分別來自信息安全、信息智能、企業存儲、閃存產品、備份恢復、大數據分析等部門。他們認為云基礎架構和大數據分析處理的最新需求趨勢是:
由于軟件智能、跨域基礎架構管理軟件包以及對象存儲開放接口技術的廣泛采用,混合云模式將變成現實;
大數據存儲將催生新型應用,IT創新和變化的速度加快;
提供單點式工具的大數據初創公司前景不樂觀,客戶需要集成式解決方案;
信息安全需要基于大數據分析的深度防御戰略;
企業級存儲將更多采用行業標準組件、企業級閃存和領先的驅動器技術;
閃存將成為常態產品,相變存儲器將迎來投資熱潮;
統一存儲方面,從服務器、網絡到存儲,將普遍采用閃存技術;
“重復數據刪除技術+磁盤備份”的模式將進一步替代磁帶備份,備份恢復朝著“IT即服務”方向發展;
企業內容管理方面,基于云服務模式、以內容為中心的解決方案將達到質變點;
由于人們越來越多地采用云和大數據,企業在IT改造中,人、流程和技術的重要性凸顯。
【關鍵詞】信息化系統 高速公路 交通數據分析 應用
一、前言
信息管理系統在高速公路交通數據分析中發揮著重要的作用,它不僅減輕了人工數據統計的體力支出和成本支出,同時也能夠較好的適應高速公路運營的出現的新情況和新問題,并能夠利用統計分析的原理加以剖析,為高速公路建設和管理的科學化提供良好的借鑒性意義,以更好保證高速公路運營的正常性,創造更多的企業效益,為經濟社會的發展提供較為穩定的基礎設施。信息管理系統廣泛應用于高速公路交通數據分析過程中,并且在高速公路交通數據分析過程中發揮著越來越重要的作用已成為一項不爭的事實,各國都注重了信息管理系統在高速公路交通數據分析中的作用,采取多種方式加以研究,力求發揮信息管理系統在高速公路交通數據分析中作用的最大化。
二、信息管理系統
作為信息管理系統是一種操縱和管理數據庫的大型軟件,用于建立、使用和維護數據庫。用戶通過訪問數據庫中的數據,數據庫管理員也進行數據庫的維護工作。它可使多個應用程序和用戶用不同的方法在同時或不同時刻去建立,修改和詢問數據庫。數據管理系統的應用增強了系統的靈活性,加快了數據分析的速度,從而更好的實現數據分享,將數據分析結果應用于政策制定和實施,從而有效的增強了政策的科學性。
三、將信息管理系統應用于高速公路交通數據分析中的意義
(一)經濟社會發展的迫切需要
伴隨著我國經濟社會的快速發展,交通運輸業也需要緊跟經濟社會發展的步伐,而高速公路的建設和發展對于交通運輸業的發展具有極其重要的意義。將信息管理系統應用于高速公路交通數據分析過程中,綜合我國經濟發展態勢和各地區的經濟發展現狀能夠更好地規劃和設計交通運輸方式,從而更好地推動經濟社會的可持續發展。
(二)高速公路管理科學化的要求
高速公路交通系統中數據分析是重要的基礎性工作。它體現公路交通系統的業務情況以及車流構成、流量、流向等特征,可以為高速公路事業的規劃、建設和管理提供科學依據。隨著我國公路收費系統步入了計算機聯網收費階段,利用高速公路信息管理系統進行高速公路的交通數據分析成為重要手段。高速公路信息管理系統從最初方案設計開始,就充分考慮整個系統的整體性和擴充性,并對高速公路信息管理系統進行合理劃分,從而更好地實現高速公路聯網收費和統一管理,做到路網內行駛一卡通和按路段合理結算,以提高高速公路管理的科學化水平。
四、廣西高速公路信息化系統建設概況
廣西高速公路收費系統是為了滿足對高速公路收費統計查詢以及分配的需要,結合現有的管理機制而分析和設計的,可分為收費管理與清分二個部分。收費管理的目的是通過利用計算機網絡和相應的軟件,并與通訊、監控系統相配合來大幅度提高收費效率以及提高財務核算的安全性和自動化程度,降低工作人員的工作強度。同時最大限度地防止各種營私舞弊現象,提高工作效率,為管理決策層提供各種相關信息。目前高速公路的管理體制,自上向下分為四層的行政管理結構,即聯網清分總中心―收費中心―收費分中心―收費站。
收費站是收費的基層單位。收費車道的原始數據匯總到收費站,收費站監控員進行當班數據的匯總,統計核對收費數據。收費站站務員對收費數據復核,并進行必要的數據糾錯,提供本收費站正確完整的匯總數據。同時收費站的原始數據實時通過TCP/IP協議上傳總中心,匯總數據在站務員輸入的同時也上傳總中心。所以,收費站一級是總中心收費數據的基礎。分中心和中心本地不保存收費數據,它訪問收費站獲得它要的數據。總中心的數據統計、數據查詢和清分是依據收費站上傳的數據。
五、從具體數據看信息管理系統在高速公路交通數據分析中的應用
(一)車流流量統計與分析應用
車流流量統計與分析應用是信息管理系統在高速公路交通數據分析中的一個方面,通過信息管理系統,我們能夠實現對高速公路車流流量統計與分析。下表為某城市路段高峰車流量分析表,見表1:
通過以上分析,我們能夠明確的看出個收費站在高峰和低峰期車流量,及各個時間段的變化和平均小時流量的變化,并根據相關數據合理安排各收費站的工作人員情況,更好的確保交通的暢通性。
(二)車流流向統計與分析應用
車流流量統計與分析應用是信息管理系統在高速公路交通數據分析中的另一個方面,下表是某城市途經A路段的綠色通道車輛流向統計表,見下表:
路段 其他路段站碼 入口車輛數 出口車輛數 合計
A路段
101 108 10782 10890
105 754 137 891
206 43 59 102
501 202 42 244
705 1158 47 1205
803 3330 11520 14850
821 77 933 1010
909 1490 3596 5086
921 2590 3352 5942
999 359 1770 2129
從表格中我們可以清楚掌握途經A路段的綠色通道車輛在全區部分路網中分布和走向情況,為高速公路管理者更清晰地認識高速公路通行費減免情況,并提供精確數據以合理決策。
(三)路段綜合信息車流量統計分析和應用
路段綜合信息車流量統計分析和應用是信息管理系統在高速公路交通數據分析中的又一個方面。下表為兩段高速A、B年度車流量綜合統計分析表:
分析項目 A 路段 B路段 AB高速合計
路段內收費站數量 5 6 11
里程(公里) 72 116 188
拆分所得通行費 16805萬 20854萬 37659萬
收取路段通行費 4693萬 14420萬 19113萬
每公里路段發生的通行費 233萬 180萬 200萬
路段內收費站出入口車流量 1639616 3576253 5215869
日均斷面車流量 5911 8009 6955
通過以上分析,我們得出了兩路段的綜合信息車流量統計分析,透過數據,我們能夠了解到路段通行費,從而實現更好的費用管理。
六、小結
信息管理系統在高速公路交通數據分析中發揮著重要的作用,高速公路交通數據分析是一個較為復雜的過程,以上只是將車流量進行了簡單的統計,交通數據分析還要對通行費、通行卡進行綜合統計。單方面通過某一種交通數據是無法的得出正確的交通數據分析結果,只有通過上述方式將多重數據綜合進行分析,才能得出所需要的結論,為高速公路的管理者和決策者提供正確的分析依據,促進我國交通運輸事業和經濟社會的快速發展。
參考文獻:
[1]段廣云,沈振宇.高速公路交通信息系統實際應用中的若干問題及對策.公路交通技術,2009年,第06期:21-22
本研究報告數據主要采用國家統計數據,海關總署,問卷調查數據,商務部采集數據等數據庫。其中宏觀經濟數據主要來自國家統計局,部分行業統計數據主要來自國家統計局及市場監測數據,企業數據主要來自于國統計局規模企業統計數據庫及證券交易所等,價格數據主要來自于各類市場監測數據庫。
報告目錄:
第一章 計算機行業報告研究標準
第一節 計算機行業研究背景
第二節 計算機行業研究方法及依據
第三節 計算機行業研究基本前景概況
第二章 計算機行業發展綜述
第一節 計算機概念
第二節 計算機行業特征分析
一、計算機作用分析
二、計算機行業在國民經濟中的地位
三、計算機行業生命周期分析
第三節 最近幾年中國行業經濟指標分析
一、贏利性
二、成長速度
三、附加值的提升空間
四、進入壁壘/退出機制
五、風險性
六、行業周期性
七、競爭激烈程度指標
八、行業成熟度分析
第四節 **行業產業鏈及上下游之間關聯性分析
第三章 XX年世界計算機行業市場分析
第一節 XX年世界計算機行業運行環境分析
一、當前經濟環境分析
二、經濟政策對產業的影響
第二節 XX年世界計算機市場競爭現狀分析
第三節 XX年世界部分國家計算機市場分析
一、歐洲地區
二、北美地區
三、亞洲地區
第四節 XX-2019年世界計算機行業新趨勢研究分析
第四章 XX年計算機行業當前發展環境分析
第一節 XX年中國計算機行業經濟環境分析
一、XX年中國宏觀經濟分析
二、XX年中國宏觀經濟發展預測
第二節 中國計算機行業政策法規解讀
第三節 中國計算機行業當前社會環境發展分析
第五章 我國計算機行業運行分析
第一節 我國計算機行業發展狀況分析
一、我國計算機行業發展階段
二、我國計算機行業發展總體概況
三、我國計算機行業發展特點分析
四、我國計算機行業商業模式分析
第二節 XX-XX年計算機行業發展現狀
一、XX-XX年我國計算機行業市場規模
二、XX-XX年我國計算機行業發展分析
三、XX-XX年中國計算機企業發展分析
第三節 區域市場分析
一、區域市場分布總體情況
二、XX-XX年重點省市市場分析
第四節 計算機細分產品市場分析
一、細分產品特色
二、XX-XX年細分產品市場規模及增速
三、重點細分產品市場趨勢分析
第五節 計算機產品價格分析
一、XX-XX年計算機價格走勢
二、影響計算機產品價格的關鍵因素分析
1、成本
2、供需情況
3、關聯產品
4、其他
三、XX-2019年計算機產品價格變化趨勢
四、主要計算機企業價位及價格策略
第六章 XX-XX年中國計算機行業技術發展分析
第一節 中國計算機行業技術發展現狀
第二節 計算機行業技術特點分析
第三節 計算機行業技術發展趨勢分析
第四節 XX年中國計算機行業發展面臨的新挑戰分析
第七章 XX-XX年中國計算機市場運行情況
第一節 行業最新動態分析
一、行業相關動態概述
二、行業發展熱點聚焦
第二節 行業品牌現狀分析
第三節 行業產品市場價格情況
第四節 行業外資進入現狀及對未來市場的威脅
第八章 XX-XX年中國計算機所屬行業主要數據監測分析
第一節 XX-XX年中國計算機所屬行業總體數據分析
一、XX年中國計算機所屬行業全部企業數據分析
二、XX年中國計算機所屬行業全部企業數據分析
三、XX年中國計算機所屬行業全部企業數據分析
第二節 XX-XX年中國計算機所屬行業不同規模企業數據分析
一、XX年中國計算機所屬行業不同規模企業數據分析
二、XX年中國計算機所屬行業不同規模企業數據分析
三、XX年中國計算機所屬行業不同規模企業數據分析
第三節 XX-XX年中國計算機所屬行業不同所有制企業數據分析
一、XX年中國計算機所屬行業不同所有制企業數據分析
一、XX年中國計算機所屬行業不同所有制企業數據分析
一、XX年中國計算機所屬行業不同所有制企業數據分析
第九章 XX-XX年中國計算機行業競爭情況
第一節 行業經濟指標分析
一、贏利性
二、附加值的提升空間
三、進入壁壘/退出機制
四、行業周期
第二節 行業競爭結構分析
一、現有企業間競爭
二、潛在進入者分析
三、替代品威脅分析
四、供應商議價能力
五、客戶議價能力
第三節 行業國際競爭力比較
第十章 XX-XX年計算機行業重點生產企業分析
第一節 a企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第二節 b企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第三節 c企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第四節 d企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第五節 e企業
一、企業簡介
二、企業經營數據
三、企業產品分析
……………
第十一章 XX-2019年計算機行業發展預測分析
第一節 XX-2019年中國計算機行業未來發展預測分析
一、中國計算機行業發展方向及投資機會分析
二、XX-2019年中國計算機行業發展規模分析
三、XX-2019年中國計算機行業發展趨勢分析
第二節 XX-2019年中國計算機行業供需預測
一、XX-2019年中國計算機行業供給預測
二、XX-2019年中國計算機行業需求預測
第三節 XX-2019年中國計算機行業價格走勢分析
第四節 XX-2019年中國**行業盈利水平分析
第十二章 XX-2019年中國計算機行業投資風險預警
第一節 XX-2019年中國**行業投資環境分析
第一節 中國計算機行業存在問題分析
第二節 中國計算機行業政策投資風險
一、政策和體制風險
二、技術發展風險
三、經營管理風險
四、供需波動風險
五、其他風險
第十三章 XX-2019年計算機行業投資機會與風險
第一節 經濟形勢給我國計算機企業帶來的機遇分析
一、為享受調控政策帶來機遇
二、為搞好戰略轉型帶來機遇
三、為吸引國際投資帶來機遇
四、為招聘高端人才帶來機遇
五、為實施戰略重組帶來機遇
六、為降低制造成本帶來機遇
第二節 經濟形勢下計算機行業發展機遇分析
一、經濟形勢為計算機企業提供了并購國外企業的機會
二、經濟形勢導致部分 經營不善的計算機企業退出市場
三、經濟形勢中我國計算機企業發展機遇分析
第三節 計算機企業戰略規劃不確定性風險
一、客觀事件的不確定性風險
二、市場的不確定性風險
三、行業發展的不確定性風險
四、技術發展的不確定性風險
五、戰略規劃者的主觀不確定性風險
六、執行過程的不確定性風險
七、工具方法的局限性風險
八、戰略規劃系統的不確定性風險
第十四章 計算機行業發展戰略研究
第一節 計算機行業發展戰略研究
一、技術開發戰略
二、產業戰略規劃
三、業務組合戰略
四、營銷戰略規劃
五、區域戰略規劃
六、企業信息化戰略規劃
第二節 計算機行業品牌戰略分析
一、品牌的基本含義
二、品牌戰略在企業發展中的重要性
三、計算機品牌的特性和作用
四、計算機品牌的價值戰略
五、我國計算機品牌競爭趨勢
六、計算機企業品牌發展戰略
七、計算機行業品牌競爭策略
第三節 計算機企業經營管理策略
一、企業經營策略綜述
二、企業產品經營策略
三、企業渠道經營策略
四、企業并購策略分析
五、當前形勢下企業經營管理策略
圖表目錄:
圖表:國內生產總值同比增長速度
圖表:全國計算機產量及其增速
圖表:規模以上工業增加值增速(月度同比)(%)
圖表:社會消費品零售總額增速(月度同比)(%)
圖表:進出口總額(億美元)
圖表:廣義貨幣(m2)增長速度(%)
圖表:居民消費價格同比上漲情況
圖表:工業生產者出廠價格同比上漲情況(%)
圖表:城鎮居民人均可支配收入實際增長速度(%)
圖表:農村居民人均收入實際增長速度
圖表:人口及其自然增長率變化情況
圖表:XX年固定資產投資(不含農戶)同比增速(%)
圖表:XX年房地產開發投資同比增速(%)
圖表:XX年中國gdp增長預測
圖表:國內外知名機構對XX年中國gdp增速預測
圖表:計算機行業產業鏈
圖表:XX-XX年計算機行業市場供給
圖表:XX-XX年計算機行業市場需求
圖表:XX-XX年計算機行業市場規模
圖表:XX年中國計算機所屬行業全部企業數據分析
圖表:XX年中國計算機所屬行業全部企業數據分析
圖表:XX年中國計算機所屬行業全部企業數據分析
圖表:XX年中國計算機所屬行業不同規模企業數據分析
圖表:XX年中國計算機所屬行業不同規模企業數據分析
圖表:XX年中國計算機所屬行業不同規模企業數據分析
圖表:XX年中國計算機所屬行業不同所有制企業數據分析
圖表:XX年中國計算機所屬行業不同所有制企業數據分析
圖表:XX年中國計算機所屬行業不同所有制企業數據分析
圖表:計算機所屬行業生命周期判斷
圖表:計算機所屬行業區域市場分布情況
圖表:XX-2019年中國計算機行業市場規模預測
圖表:XX-2019年中國計算機行業供給預測
圖表:XX-2019年中國計算機行業需求預測
[關鍵詞]大數據;預測精度;數據挖掘;自適應;數據質量
doi:10.3969/j.issn.1673 - 0194.2017.02.031
[中圖分類號]F273 [文獻標識碼]A [文章編號]1673-0194(2017)02-00-07
1 大數據時代對煙草行業的影響
大數據應用于煙草信息研發,能使煙草行業充分了解、及時掌握當今世界的煙草信息,有效調整煙草戰略、市場決策,使行業立于不敗之地。
凌成興在2014年全國煙草工作會議上提出煙草行業要深入思考、積極謀劃、努力實踐“三大課題”,即深入思考、積極謀劃、努力實踐改革的紅利在哪里?發展的潛力在哪里?追趕的目標在哪里?這是我國煙草行業今后一段時期內努力發展的方向和奮斗的目標。
煙草企業借助大數據研發應用的分析,可以隨時掌握世界新的煙草信息,捕捉其技術要領,了解其發展的先進性與適應性,并為我所用,從而可以積極有效地推動我國煙草行業的發展,促進“三大課題”的努力實踐和圓滿成功,為我國煙草行業快速、高效地發展提供堅實的信息技術后盾,奠定快速、高效發展的堅實基礎。第一,它可以進一步優化煙草市場的資源配置,建立統一開放、競爭有序的市場體系,創造和釋放煙草改革的紅利空間。因為大數據的研發應用本身就是一次全新的信息技術改革。第二,它能不斷地挖掘結構調整、國際市場、貨幣資金保值增值所蘊藏的發展潛能,努力實現煙草“十三五”的奮斗目標。第三,它能早日實現我國追趕煙草跨國公司前三名、煙機制造公司的“排頭兵”、原材料與輔助材料生產的大集團的新目恕⑿呂硐搿⑿亂求,實現中國煙草行業進入新的發展格局的目標。
大數據的應用分析,是當今信息時代又一次全新的、更高的、更龐大的與更復雜的信息化技術革命。它對提高現代經濟分析能力和管理水平、提高一個行業或一個單位的準確決策和經濟實力的能力,有著不可估量的積極作用,蘊藏著巨大的潛力和能量。
2 煙草制造過程中大數據工藝管控和常規數理統計工藝管控的差異分析
現階段行業內卷煙廠工藝管控主要以常規數理統計算法為主,輔助以信息化的手段實現預警控制。例如上海卷煙廠通過加入SPC對應的判異準則,固化至信息化系統中,創新地提出了SPCD的管控方法。青島卷煙廠通過將6 sigma分析的指標權重納入信息化實時預警管控分析,創新性地提出了卷煙制造過程能力信息化預警分析的管控方法。迄今為止,煙草行業內還沒有卷煙廠實現了以大數據算法為核心的工藝管控實例,即通過大數據分析方法全面補充和完善常規數理統計的短板,實現工藝智能化管控水平的螺旋式上升。本文將從四個方面對大數據分析與常規數理統計在工藝管控層面的差異進行對比,旨在全面凸顯大數據分析的優勢,進而對煙草制造過程中信息化工藝管控的前景進行探索。
2.1 預測精度對比
大數據預測有別于常規數理統計的回歸分析,常規數理統計的回歸分析是建立在數據均滿足正態性和樣本獨立性兩個條件為前提的,同時在回歸過程中要通過逐步回歸剔除對應的異常點,方能進行回歸算法的計算。而大數據預測則無需這些條件的限制,可直接根據特征樣本進行訓練,直接得出對應的預測結果。
2.1.1 常規數理統計分析
以某卷煙廠烘絲出口水分為例進行說明。
對影響烘絲出口水分對應的過程參數建立對應的回歸方程表如表1所示。
由圖1可以看出,葉絲冷卻出料含水率的四合一殘差圖以及各自變量殘差圖分布均勻,滿足齊次、正態等特點。
根據回歸方程對測試集數據進行預測,如表4所示。
將預測值與真實值進行偏差計算,如表5所示。
2.1.2 大數據分析
首先,對影響烘絲出口水分對應的過程參數建立隨機樹模型,如圖2所示。
從圖2中可以看出,參數4離線程度最大,因此參數4重要度最高,根據離線度得出其參數重要性排序為參數4(葉絲干燥出料含水率)>參數1(葉絲干燥Ⅰ區筒壁溫度)>參數2(葉絲干燥Ⅱ區筒壁溫度)>參數3(葉絲干燥熱風溫度)>參數5(葉絲干燥出料溫度)。
再進行決策樹分析,根據決策樹得出如下對應的過程參數與關鍵質量特性二叉樹(如圖3所示)。
然后根據隨機樹運算結果進行預測,如表6所示。
最后將預測值與真實值進行偏差計算,如表7所示。
2.1.3 大數據分析與常規數理統計預測精度對比
大數據分析與常規數理統計預測精度對比,如圖4所示。
通過繪制時間序列圖,將常規梳理統計預測值、大數據預測值分別與真實值進行偏差對比,可以看出,大數據預測精度遠大于常規梳理統計的預測精度。
2.2 數據挖掘能力對比
常規數理統計需要挖掘數據隱含的信息,需要借助相應的現場分析為手段,例如需分析出結果指標的異常是因為哪類過程指標異常導致的。其需要建立各級過程指標對結果指標的影響程度,其次在結果指標異常時通過現場人員從影響程度高的指標進行逐一排查。而大數據分析可直接通過結果指標的允許范圍得出各級過程指標的取值范圍,自動進行預測分析并得出對應的結論。
2.2.1 常規數理統計分析
以某卷煙廠加料出口水分為例進行說明。
第一步:計算各級參數的Pearson系數,形成對應的Pearson矩陣,如表8、表9所示。
第二步:將各級參數的R值進行排列。
由以上的Pearson矩陣可以得出,各級參數與結果指標P值均小于0.05,表明各級參數均與結果指標相關,并得出各級參數的相關性R值大小,如表10所示。
繪制出如圖5的餅圖。
2.2.2 大數據分析
第一步:通過決策樹形成重要度排列圖,如圖6所示。
第二步:通過神經網絡求出結果指標對應的過程指標的相應范圍。
基于結果指標的望目特性(中心值是18.20%)的允差上下限為[17.20%,19.20%],運用大數據預測技術得出各級過程參數對應的有效取值范圍。
運用R語言分析,一級加料入口含水率預測有效范圍如圖7所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料入口含水率有效取值范圍應為[16.07%,16.75%]。
運用R語言分析,一級加料工藝熱風溫度預測范圍如圖8所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料工藝熱風溫度有效取值范圍應為[52.06%,51.90%]。
運用R語言分析,一級加料蒸汽自動閥門開度預測有效范圍如圖9所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料蒸汽自動閥門開度有效取值范圍應為[51.70%,53.63%]。
運用R語言分析,一級加料出料溫度預測有效范圍如圖10所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料出料溫度有效取值范圍應為[51.27℃,53.59℃]。
運用R語言分析,一級加料工藝流量預測有效范圍如圖11所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料工藝流量有效取值范圍應為[2 946kg/h,3 000kg/h]。
小結:通過對比大數據分析和常規梳理統計分析,可以看出,大數據能夠實現通過結果指標的取值范圍挖掘出過程指標的取值范圍。而常規梳理統計只能做到重要度的排序,因此,大數據分析對應的數據挖掘能力遠大于常規數理統計分析對應的數據挖掘能力。
2.3 自適應能力對比
常規數理統計不具備自適應的算法,所謂的自適應算法,是指處理和分析過程中,能夠根據被處理數據的數據特征自動調整處理方法、處理順序、處理參數、邊界條件或約束條件,使其與所處理數據的統計分布特征、結構特征相適應,以取得最佳的處理效果。
大數據分析由于加載了自適應分析模塊,通過加載機器自學習算法,能夠實現“松耦合、高擴展、低成本”的柔性化控制,即能夠通過機器自學習自動根據數據特性的變化得出對應的新的控制標準,避免了卷煙廠的重復、不必要的投資,實現系統由原先的“封閉式”轉變為“自我更新,自我優化”,提升系統的競爭力。圖12為自適應分析算法流程圖。
第一步:加d自適應算法
能夠加載自適應算法,按照自適應模型進行機器自學習,確保其能不斷滿足生產的實際情況。
第二步:根據數據質量特性運用機器自學習形成新的標準
以松散回潮出口水分為例,其2015年和2016年通過機器自學習得出控制標準,運用R語言分析,得出結果,如圖13所示。
圖13 松散回潮出口水分標準自適應結果
從機器自學算法可以看出,2015年松散回潮出料含水率標準為[15.41%,18.32%],而2016年松散回潮出料含水率標準自適應變更為[14.30%,17.29%]。
2.4 數據質量分析能力對比
常規數理統計無法通過對應的方法實現對數據真實性、完整性、及時性與是否進行加載的平滑算法進行驗證。需要從別的角度進行分析和驗證。例如需要從底層PLC程序、上位WINCC程序進行解讀才能知道是否加載了平滑算法。對數采點時間是否對應進行數據及時性的分析。大數據分析由于集成了擬合分布、AdaBoost、延遲有效性判斷等算法,可實現數據真實性、完整性、及時性與是否采用平滑算法進行全面的分析和判斷。
數據真實性判斷:數據真實性判斷通過擬合分布來實現。通過自適應建立各關鍵工序對應的擬合分布情況,進行擬合分布檢驗,當檢驗結果存在顯著差異時,其數據的真實性就有待質疑。
數據完整性判斷:數據完整性判斷通過AdaBoost管控來實現。以歷史數據為依據,建立以來料重量為依據的數采樣本量預測區間,當實際數采樣本數據量不在置信區間時,其數據的完整性就有待質疑。
數據及時性判斷:數據及時性判斷通過延遲判斷有效性來實現。以歷史數據為依據,建立各關鍵工序的數采延遲庫,進行單樣本T檢驗,當檢驗結果存在顯著差異時,其數據的及時性就有待質疑。
數據是否采用平滑算法判斷:建立數據質量驗證功能庫,加載多種算法,對數據是否采用平滑算法進行驗證,通過以下兩種方法根據實際情況進行篩選,得出數據質量驗證可信度。
第一種對每種算法加載不同的權重,采用加權的方式得出最終的可信度得分。
第二種對某種基本算法加入一票否決項,當某種算法無法通過時,則直接將數據可信度置為0。其他算法無法通過時,采用扣分的形式得出最終的可信度得分。
當可信度低時,則認為數據可能存在平滑處理的可能。
以數據真實判斷為示例進行說明,進而說明大數據的數據質量分析能力。
以某煙廠制絲烘絲工序為例進行演示。
通過大數據進行擬合優度檢驗。
伽馬分布判斷,如圖14所示。
由圖14可知,數據歸集不全聚類于伽馬分布的線性要求,因此數據特性分布不滿足伽馬分布。
對數正態分布判斷,如圖15所示。
由圖15可知,數據歸集聚類于對數正態分布的線性要求,因此數據特性分布滿足對數正態分布。
Weibull(威布爾)分布判斷,如圖16所示。
由圖16可知,數據歸集不全聚類于Weibull分布的線性要求,因此數據特性分布不滿足Weibull分布。
正態分布判斷,如圖17所示。
由圖17可知,數據歸集不全聚類于正態分布的線性要求,因此數據特性分布不滿足正態分布。
通過檢驗可以看出,其烘絲出口水分歷史數據滿足對數正態分布。
通過對實際某批次烘絲出口水分進行分析,情況如圖18所示。
由D18可知,數據歸集聚類于正態分布的線性要求,因此數據特性分布滿足正態分布。與歷史數據的分布不同(傳統數據服從對數正態分布),因此判斷其數據的真實性有待商榷。
3 大數據技術在煙草制造過程中工藝管控的運用前景
大數據技術在煙草制造過程中工藝管控的運用前景可概括為以下3點。
3.1 可實現工藝管控“三級聯動”的智能診斷分析
運用大數據技術,建立生產技術標準執行力的三級聯動診斷機制,形成標準執行力評價與結果指標評價相結合的紐帶,當結果指標異常時能智能診斷出是哪個過程指標異常導致的,這是一級診斷。除了分析過程指標以外,還能針對“5M1E”(人、機、料、法、環、測)保障因素進行聯動診斷分析,深入挖掘原因,這是第二級診斷。在找到原因后,還能通過專家庫自動發送對應的解決方案,這是第三級診斷。通過三級診斷分析全面建立一個包含“發現問題、分析問題、解決問題”的智能化PDCA循環,全面提升工藝管控智能化的管控水平。
3.2 可實現智能化料頭與料尾的自動截取
運用大數據技術,以歷史數據為依據,通過對歷史數據的分布運用聚類分析方法,將數據值區分為待機值、臨界值、穩態值三類,同時結合差分方法,更為準確地判斷料頭與料尾的位置,進一步實現非穩態數據的智能篩選。
例如,通過對一段時間內“葉絲干燥出料含水率”的生產數采數據進行聚類分析,分類結果如圖19所示,第一類為穩態數據,第二類為料頭料尾數據,第三類為待機數據。
根據以上分析,加載對應的自適應算法,即可實現對所有批次的智能化料頭與料尾的自動截取功能。
3.3 可實現生產技術標準適用性自適應分析
運用大數據技術,能夠根據大數據的方法對關鍵質量特性的相關性進行實時更新,并與生產技術的標準進行全面對比,提供生產技術標準適用性分析結果,如圖20所示。
能夠根據大數據隨機森林(樹)的方法對關鍵質量特性的重要度(當需要處理的數據龐大和實時性要求較高時,普通隨機樹建模過程耗時長,因此在部署“云”平臺的稚嫩診斷模型時,在隨機樹建模過程中加入了數據集特征提取)進行實時更新,通過與生產技術標準實時對比:①若關鍵質量特性與生產技術標準一致,則運行生產技術標準執行力自適應分析功能;②若關鍵質量特性與生產技術標準出現不一致的情況,則選擇一定周期內穩態數據運行關鍵質量特性自適應相關性擬合分析,形成生產技術標準執行力自適應分析結果,為生產技術標準的變更或換版提供數據支撐。
4 結 語
通過以上運用前景的初探,充分說明了大數據在煙草制造過程工藝管控發展前景較為廣闊,相信不久的將來,基于大數據分析的煙草制造過程中工藝管控的卷煙廠數量也將大幅提升,大數據技術將幫助卷煙廠的工藝控制水平實現螺旋式上升。
注:李達,通訊作者
主要參考文獻
[1]閆磊.煙草行業分銷管理系統[D].濟南:山東大學 2008.
[2]段永光.中國煙草工業兼并重組績效研究[D].長沙:中南大學,2008.
[3]羅民軍.株洲市煙草公司財務管理模式優化研究[D].長沙:中南大學,2008.
[4]李民燈.HH市煙草公司人力資源管理體系診斷與優化研究[D]. 長沙:中南大學,2008.
[5]劉兆茜.企業信息化評價指標體系研究與應用[D].上海:復旦大學,2008.
[6]梁忠偉.制度變遷視角下的我國煙草專賣制改革[D].廣州:暨南大學, 2008.
[7]陳軍.上海煙草集團公司生產計劃管理發展探討[D].上海:復旦大學, 2008.