數據處理的基本目的是從大量的、可能是雜亂無章的、難以理解的數據中抽取并推導出對于某些特定的人們來說是有價值、有意義的數據。
數據處理對數據(包括數值的和非數值的)進行分析和加工的技術過程。包括對各種原始數據的分析、整理、計算、編輯等的加工和處理。比數據分析含義廣。隨著計算機的日益普及,在計算機應用領域中,數值計算所占比重很小,通過計算機數據處理進行信息管理已成為主要的應用。
如測繪制圖管理、倉庫管理、財會管理、交通運輸管理,技術情報管理、辦公室自動化等。在地理數據方面既有大量自然環(huán)境數據(土地、水、氣候、生物等各類資源數據),也有大量社會經濟數據(人口、交通、工農業(yè)等),常要求進行綜合性數據處理。
擴展資料:
數據處理的基本方式:
根據處理設備的結構方式、工作方式,以及數據的時間空間分布方式的不同,數據處理有不同的方式。不同的處理方式要求不同的硬件和軟件支持。每種處理方式都有自己的特點,應當根據應用問題的實際環(huán)境選擇合適的處理方式。
數據處理主要有四種分類方式:
1、根據處理設備的結構方式區(qū)分,有聯(lián)機處理方式和脫機處理方式。
2、根據數據處理時間的分配方式區(qū)分,有批處理方式、分時處理方式和實時處理方式。
3、根據數據處理空間的分布方式區(qū)分,有集中式處理方式和分布處理方式。
4、根據計算機中央處理器的工作方式區(qū)分,有單道作業(yè)處理方式、多道作業(yè)處理方式和交互式處理方式。
參考資料來源:百度百科-數據處理
一、線路交換
所謂線路交換是通過網絡中的節(jié)點在兩個站之間建立一條專用的通訊線路。如圖1的電話系統(tǒng),這種線路交換系統(tǒng),在兩個站之間有一個實際的物理連接,這種連接是節(jié)點之間的連接序列。在傳輸任何數據之間都必須建立點到點的線路。如站1發(fā)送一個請求到節(jié)點2,請求與站點2建立一個連接,那么站點1到節(jié)點1是一條專用線路。在交換機上分配一個專用的通道連接到節(jié)點2再到站點2的通訊。至此就建立了一條從站點1經過節(jié)點2再到站點2的通訊物理通道。這樣就可以將話音從站點1傳送到站點2了,一般來說這種連接是全雙工的,可以在兩個方向傳輸話音(數據)。
二、報文交換
這種交換方式不需要在兩個站點之間建立一條專用通路,如果一個站想要向站點2發(fā)送一個報文(信息的一個邏輯單位),它把站點2的地址(編碼方式,叫做地址碼)附加在要發(fā)送的報文上。然后把報文通過網絡從節(jié)點到節(jié)點進行發(fā)送,在每個節(jié)點中(如要通過多個節(jié)點才能發(fā)送到站點2)完整地接收整個報文且暫存這個報文,然后再發(fā)送到下一個節(jié)點。在交換網中,每個節(jié)點是一個電子或機電結合的交換設備,每個節(jié)點通常是一臺通用的小型計算機。它具有足夠的存儲容量來緩存進入的報文。一個報文在每個節(jié)點的延遲時間等于接收報文的所有位所需要的時間,加上等待時間和重傳到下一節(jié)點所需要的排隊延時時間。
報文交換有以下優(yōu)點
1、線路效率較高,這是因為許多報文可以用分時方式共享一條節(jié)點到節(jié)點的通道。
2、不需要同時使用發(fā)送器和接收器來傳輸數據,網絡可以在接收器可用之前暫時存儲這個報文。
3、在線路交換網上,當通訊量變得很大時,就不能接受某些呼叫。而在報文交換上卻仍然可以接收報文,只是傳送延遲會增加。
4、報文交換系統(tǒng)可以把一個報文發(fā)送到多個目的地。
5、能夠建立報文的優(yōu)先權。
6、報文交換網可以進行速度和代碼的轉換,因為每個站都可以用它特有的數據傳輸率連接到其他點,所以兩個不同傳輸率的站也可以連接,另外還可以轉換傳輸數據的格式。
三、分組交換
分組交換方式兼有報文交換和線路交換的優(yōu)點。其形式上非常像報文交換。主要差別在于分組交換網中要限制傳輸的數據單位長度,一般在報文交換系統(tǒng)中可傳送的報文數據位數可做得很長,而在分組交換中,傳送報文的最大長度是有限制的,如超出某一長度,報文必須要分割成較少的單位,然后依次發(fā)送,我們通常稱這些較少的數據單位為分組。這就是報文交換與分組交換所不同之處。
變量變換也稱變量代換,是將原數據X轉換成它的某種函數值如lgX,X1/2等,其目的是使變換后的數據達到某種要求。例如運用方差分析作多個均數間的比較時,要求各樣本所來自的總體分布是正態(tài)的,方差是相同的,以及處理的效應是可加的。如果樣本所來自的總體偏離這三個條件太遠,方法之一是進行變量變換,使之達到上述要求。又如求曲線回歸方程時,常作變量變換,使之達到直線化的要求。此外,在計算過程中,常用變量變換達到簡化運算的要求等等。應該指出的是,根據變換值進行統(tǒng)計分析,常用以說明原數據的信息,而且常需還原成原數據的單位。運用方差分析時,總體的非正態(tài)性、方差的非齊性和效應的不可加性這三者常常一起發(fā)生,往往經過某種變量變換改正其中之一時,可使其余兩者亦有所改善。
變量變換的常用方法有對數變換、平方根變換、平方根反正弦變換、概率單位變換、logit變換、反雙曲正切變換、倒數變換、乘方變換等。方法的選擇要根據變換的目的和原數據的性質、分布特征,特別是變換后的效果。當變換所得數值仍未達到預期的要求時,應具體分析其原因,再按照資料的性質用不同的變換方法嘗試,但不要盲目亂試。
科技成果轉化主要有五種方式:①自行投資實施轉化;②向他 人轉讓科技成果;③許可他人使用科技成果;④以科技成果作為合作條件,與他人共同實施轉化;⑤以該科技成果作價投資,折算股份或者出資 比例。
其中,第一種方式屬于科技成果持有人自行轉化,即高等院校、科研 院所或企業(yè)等主體將其研發(fā)的科技成果應用于本單位的生產活動,此方 式的特點是沒有中間環(huán)節(jié),降低了成果轉化的交易成本,但僅適合于研發(fā) 生產鏈條較為完善的主體。第二、第三種方式屬于轉移式轉化,即科技成 果持有人通過許可、轉讓的方式將科技成果的使用權或所有權轉移給技 術需求方,此方式是髙等院校、科研院所實現科技成果轉化的主要方式。
第四、第五種方式屬于合作轉化方式,此方式有利于產、學、研單位以技術 為紐帶形成利益共享、風險共擔的合作機制。
② 數據分析為了挖掘更多的問題,并找到原因;③ 不能為了做數據分析而坐數據分析。
2、步驟:① 調查研究:收集、分析、挖掘數據② 圖表分析:分析、挖掘的結果做成圖表3、常用方法: 利用數據挖掘進行數據分析常用的方法主要有分類、回歸分析、聚類、關聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等,它們分別從不同的角度對數據進行挖掘。 ①分類。
分類是找出數據庫中一組數據對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數據庫中的數據項映射到某個給定的類別。它可以應用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購買趨勢預測等,如一個汽車零售商將客戶按照對汽車的喜好劃分成不同的類,這樣營銷人員就可以將新型汽車的廣告手冊直接郵寄到有這種喜好的客戶手中,從而大大增加了商業(yè)機會。
②回歸分析?;貧w分析方法反映的是事務數據庫中屬性值在時間上的特征,產生一個將數據項映射到一個實值預測變量的函數,發(fā)現變量或屬性間的依賴關系,其主要研究問題包括數據序列的趨勢特征、數據序列的預測以及數據間的相關關系等。
它可以應用到市場營銷的各個方面,如客戶尋求、保持和預防客戶流失活動、產品生命周期分析、銷售趨勢預測及有針對性的促銷活動等。 ③聚類。
聚類分析是把一組數據按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數據間的相似性盡可能大,不同類別中的數據間的相似性盡可能小。它可以應用到客戶群體的分類、客戶背景分析、客戶購買趨勢預測、市場的細分等。
④關聯(lián)規(guī)則。關聯(lián)規(guī)則是描述數據庫中數據項之間所存在的關系的規(guī)則,即根據一個事務中某些項的出現可導出另一些項在同一事務中也出現,即隱藏在數據間的關聯(lián)或相互關系。
在客戶關系管理中,通過對企業(yè)的客戶數據庫里的大量數據進行挖掘,可以從大量的記錄中發(fā)現有趣的關聯(lián)關系,找出影響市場營銷效果的關鍵因素,為產品定位、定價與定制客戶群,客戶尋求、細分與保持,市場營銷與推銷,營銷風險評估和詐騙預測等決策支持提供參考依據。 ⑤特征。
特征分析是從數據庫中的一組數據中提取出關于這些數據的特征式,這些特征式表達了該數據集的總體特征。如營銷人員通過對客戶流失因素的特征提取,可以得到導致客戶流失的一系列原因和主要特征,利用這些特征可以有效地預防客戶的流失。
⑥變化和偏差分析。偏差包括很大一類潛在有趣的知識,如分類中的反常實例,模式的例外,觀察結果對期望的偏差等,其目的是尋找觀察結果與參照量之間有意義的差別。
在企業(yè)危機管理及其預警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應用到各種異常信息的發(fā)現、分析、識別、評價和預警等方面。
⑦Web頁挖掘。

聲明:本網站尊重并保護知識產權,根據《信息網絡傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個月內通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學習鳥. 頁面生成時間:2.990秒