1.漢字的輸入編碼 為了能直接使用西文標(biāo)準(zhǔn)鍵盤(pán)把漢字輸入到計(jì)算機(jī),就必須為漢字設(shè)計(jì)相應(yīng)的輸入編碼方法。當(dāng)前采用的方法主要有以下三類(lèi): 數(shù)字編碼 常用的是國(guó)標(biāo)區(qū)位碼,用數(shù)字串代表一個(gè)漢字輸入。區(qū)位碼是將國(guó)家標(biāo)準(zhǔn)局公布的6763個(gè)兩級(jí)漢字分為94個(gè)區(qū),每個(gè)區(qū)分94位,實(shí)際上把漢字表示成二維數(shù)組,每個(gè)漢字在數(shù)組中的下標(biāo)就是區(qū)位碼。區(qū)碼和位碼各兩位十進(jìn)制數(shù)字,因此輸入一個(gè)漢字需按鍵四次。
數(shù)字編碼輸入的優(yōu)點(diǎn)是無(wú)重碼,且輸入碼與內(nèi)部編碼的轉(zhuǎn)換比較方便,缺點(diǎn)是代碼難以記憶。
拼音碼 拼音碼是以漢字拼音為基礎(chǔ)的輸入方法。使用簡(jiǎn)單方便,但漢字同音字太多,輸入重碼率很高,同音字選擇影響了輸入速度。
字形編碼 字形編碼是用漢字的形狀來(lái)進(jìn)行的編碼。把漢字的筆劃部件用字母或數(shù)字進(jìn)行編碼,按筆劃的順序依次輸入,就能表示一個(gè)漢字。
為了加快輸入速度,在上述方法基礎(chǔ)上,發(fā)展了詞組輸入\聯(lián)想輸入等多種快速輸入方法。但是都利用了鍵盤(pán)進(jìn)行“手動(dòng)”輸入。理想的輸入方式是利用語(yǔ)音或圖象識(shí)別技術(shù)“自動(dòng)”將拼音或文本輸入到計(jì)算機(jī)內(nèi),使計(jì)算機(jī)能認(rèn)識(shí)漢字,聽(tīng)懂漢語(yǔ),并將其自動(dòng)轉(zhuǎn)換為機(jī)內(nèi)代碼表示。目前這種理想已經(jīng)成為現(xiàn)實(shí)。
2.漢字內(nèi)碼 漢字內(nèi)碼是用于漢字信息的存儲(chǔ)、交換、檢索等操作的機(jī)內(nèi)代碼,一般采用兩個(gè)字節(jié)表示。英文字符的機(jī)內(nèi)代碼是七位的ASCII碼,當(dāng)用一個(gè)字節(jié)表示時(shí),最高位為“0”。為了與英文字符能相互區(qū)別,漢字機(jī)內(nèi)代碼中兩個(gè)字節(jié)的最高位均規(guī)定為“1”。
注意:有些系統(tǒng)中字節(jié)的最高位用于奇偶校驗(yàn)位,這種情況下用三個(gè)字節(jié)表示漢字內(nèi)碼。
3.漢字字模碼 字模碼是用點(diǎn)陣表示的漢字字形代碼,它是漢字的輸出形式。
根據(jù)漢字輸出的要求不同,點(diǎn)陣的多少也不同。字模點(diǎn)陣的信息量很大,所占存儲(chǔ)空間也很大。因此字模點(diǎn)陣只能用來(lái)構(gòu)成漢字庫(kù),而不能用于機(jī)內(nèi)存儲(chǔ)。字庫(kù)中存儲(chǔ)了每個(gè)漢字的點(diǎn)陣代碼。當(dāng)顯示輸出或打印輸出時(shí)才檢索字庫(kù),輸出字模點(diǎn)陣,得到字形。
圖2.1 漢字的字模點(diǎn)陣及編碼
注意,漢字的輸入編碼、漢字內(nèi)碼、字模碼是計(jì)算機(jī)中用于輸入、內(nèi)部處理、輸出三種不同用途的編碼,不要混為一談。
機(jī)內(nèi)碼 國(guó)標(biāo)碼:是指我國(guó)1981年公布的“中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)信息交換漢字編碼”,代號(hào)為“GB2312-80”。
由連續(xù)的兩個(gè)字節(jié)組成。 2.機(jī)內(nèi)碼:在計(jì)算機(jī)內(nèi)表示漢字的代碼是漢字機(jī)內(nèi)碼,漢字機(jī)內(nèi)碼由國(guó)標(biāo)碼演化而來(lái),把表示國(guó)標(biāo)碼的兩個(gè)字節(jié)的最高位分別加“1”,就變成漢字機(jī)內(nèi)碼 3.輸入碼:漢字輸入碼是指直接從鍵盤(pán)輸入的各種漢字輸入方法的編碼,屬于外碼。
4.字型點(diǎn)陣碼:用點(diǎn)陣方式來(lái)構(gòu)造漢字字型,然后存儲(chǔ)在計(jì)算機(jī)內(nèi),構(gòu)成漢字字模庫(kù)。目的是為了能顯示和打印漢字。
(1)區(qū)位碼先轉(zhuǎn)換成十六進(jìn)制數(shù)表示 (2)(區(qū)位碼的十六進(jìn)制表示)+2020H=國(guó)標(biāo)碼; (3)國(guó)標(biāo)碼+8080H=機(jī)內(nèi)碼 漢字的機(jī)內(nèi)碼是指在計(jì)算機(jī)中表示一個(gè)漢字的編碼。機(jī)內(nèi)碼與區(qū)位碼稍有區(qū)別。
漢字區(qū)位碼的區(qū)碼和位碼的取值均在1~94之間,如直接用區(qū)位碼作為機(jī)內(nèi)碼,就會(huì)與基本ASCII碼混淆。為了避免機(jī)內(nèi)碼與基本ASCII碼的沖突,需要避開(kāi)基本ASCII碼中的控制碼(00H~1FH),還需與基本ASCII碼中的字符相區(qū)別。
為了實(shí)現(xiàn)這兩點(diǎn),可以先在區(qū)碼和位碼分別加上20H,在此基礎(chǔ)上再加80H(此處“H”表示前兩位數(shù)字為十六進(jìn)制數(shù))。經(jīng)過(guò)這些處理,用機(jī)內(nèi)碼表示一個(gè)漢字需要占兩個(gè)字節(jié),分別 稱(chēng)為高位字節(jié)和低位字節(jié),這兩位字節(jié)的機(jī)內(nèi)碼按如下規(guī)則表示: 高位字節(jié)=區(qū)碼+20H+80H(或區(qū)碼+A0H) 低位字節(jié)=位碼+20H+80H(或位碼+AOH) 由于漢字的區(qū)碼與位碼的取值范圍的十六進(jìn)制數(shù)均為01H~5EH(即十進(jìn)制的01~94),所以漢字的高位字節(jié)與低位字節(jié)的取值范圍則為A1H~FEH(即十進(jìn)制的161~254)。
例如,漢字“啊”的區(qū)位碼為1601,區(qū)碼和位碼分別用十六進(jìn)制表示即為1001H,它的機(jī)內(nèi)碼的高位字節(jié)為B0H,低位字節(jié)為A1H,機(jī)內(nèi)碼就是B0A1H。 2603 = 1A03H 區(qū)位碼 + A0A0H = BAA3H 機(jī)內(nèi)碼 漢字的編碼知識(shí) 信息編碼各國(guó)有各國(guó)不同的編碼,國(guó)際上統(tǒng)一使用的編碼為ASCII(美國(guó)標(biāo)準(zhǔn)信息交換代碼),我國(guó)使用的有國(guó)標(biāo)碼BG(中文),和BIG5(中文繁體)兩種。
附帶要知道:中文字庫(kù)(字庫(kù)文件名,大小,擴(kuò)展名,存放位置) 中文輸入方法(語(yǔ)音輸入,鍵盤(pán)輸入,手寫(xiě)輸入,掃描輸入等) 1.漢字的編碼 (1)國(guó)標(biāo)碼:是指我國(guó)1980年公布的“信息交換漢字編碼字符集”,代號(hào)為“GB2312-80”。由連續(xù)的兩個(gè)字節(jié)組成。
(2)機(jī)內(nèi)碼:在計(jì)算機(jī)內(nèi)表示漢字的代碼是漢字機(jī)內(nèi)碼,漢字機(jī)內(nèi)碼由國(guó)標(biāo)碼演化而來(lái),把表示國(guó)標(biāo)碼的兩個(gè)字節(jié)的最高位分別加“1”,就變成漢字機(jī)內(nèi)碼。 (3)輸入碼:漢字輸入碼是指直接從鍵盤(pán)輸入的各種漢字輸入方法的編碼,屬于外碼。
(4)字型點(diǎn)陣碼:用點(diǎn)陣方式來(lái)構(gòu)造漢字字型,然后存儲(chǔ)在計(jì)算機(jī)內(nèi),構(gòu)成漢字字模庫(kù)。目的是為了能顯示和打印漢字。
編碼的轉(zhuǎn)換舉例 漢字 區(qū)位碼 16進(jìn)制 國(guó)標(biāo)碼 機(jī)內(nèi)碼 文 4636 2E24H 4E44H CEC4H “文”的區(qū)位碼為4636,區(qū)碼和位碼分別用16進(jìn)制表示即為“2E24H”, 0010 1110 0010 0100轉(zhuǎn)換成國(guó)標(biāo)碼“4E44H”,0100 1110 0100 0100機(jī)內(nèi)碼為“CEC4H”, 1100 1110 1100 0100 2.漢字的輸入方法 漢字輸入方法目前有兩大類(lèi)四種。 (1)鍵盤(pán)輸入法。
這是最常用的,利用各種漢字輸入方法的編碼敲擊鍵盤(pán)來(lái)輸入漢字; (2)非鍵盤(pán)輸入法。目前主要有三種方法。
手寫(xiě)筆輸入法:利用漢字識(shí)別技術(shù),通過(guò)書(shū)寫(xiě)筆在感應(yīng)板上書(shū)寫(xiě)漢字把其輸入的方法。 語(yǔ)音輸入法:利用語(yǔ)音識(shí)別技術(shù),通過(guò)口說(shuō)來(lái)輸入漢字。
掃描識(shí)別輸入,是將印或?qū)懺诩埳系臐h字通過(guò)掃描儀輸入計(jì)算機(jī),再經(jīng)相應(yīng)軟件處理后轉(zhuǎn)換成漢字機(jī)內(nèi)碼。 3.漢字字符集的概念 有兩種漢字字符集。
(1)國(guó)標(biāo)碼字符集GB2312-80:該字符集收錄了6763個(gè)常用漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè)。另外還收錄了各種符號(hào)682個(gè),合計(jì)7445個(gè)。
(2)GBK漢字集:GBK即漢字?jǐn)U充內(nèi)碼規(guī)范,又稱(chēng)大字符集,一共收錄了20900個(gè)漢字。在Windows簡(jiǎn)體中文版中,又增加了101個(gè)補(bǔ)充字,一共有21001個(gè)字。
它包容了GB2312-80的6763個(gè)常用漢字,臺(tái)灣BIG5碼收錄了13000多個(gè)漢字,是目前見(jiàn)到的收錄漢字最多的漢字系統(tǒng)。
584,5682177778,12234.1798,76868.587129955,829475我發(fā)誓,我要抱你一起去吹吹風(fēng),與你愛(ài)相隨。
一起走吧,去溜噠溜噠。我不介意你久久吻我,被愛(ài)就是幸福。
1部: 1240最?lèi)?ài)是你; 1314一生一世; 1372一廂情愿; 1314925一生一世就愛(ài)我; 1392010一生就愛(ài)你一個(gè); 1414意思意思; 147一世情; 1573一往情深; 1711一心一意; 2部: 200愛(ài)你哦; 20160愛(ài)你一萬(wàn)年; 20184愛(ài)你一輩子; 2037為你傷心; 20475愛(ài)你是幸福; 20609愛(ài)你到永久; 20863愛(ài)你到來(lái)生; 230愛(ài)上你; 246餓死了; 246437愛(ài)是如此神奇; 20910愛(ài)我久一點(diǎn); 259695愛(ài)我就了解我; 259758愛(ài)我就娶我吧; 2627愛(ài)來(lái)愛(ài)去; 282餓不餓; 296愛(ài)走了; 2925184愛(ài)就愛(ài)我一輩子; 3部: 300想你哦; 30920想你就想你; 309420想你就是愛(ài)你; 3013想你一生; 32012想念你的愛(ài); 32069想愛(ài)你很久; 3207778想和你去吹吹風(fēng); 3399長(zhǎng)長(zhǎng)久久; 330335想想你想想我; 3344生生世世; 356上網(wǎng)了; 35910想我久一點(diǎn); 3731真心真意; 4部: 440295謝謝你愛(ài)過(guò)我; 4457速速回機(jī); 4422335時(shí)時(shí)刻刻想想我; 456是我啦; 460想念你; 505求救(SOS); 510我依你、我已來(lái); 507680我一定要追你; 51020我依然愛(ài)你; 51095我要你嫁我; 51396我要睡覺(jué)了; 514無(wú)意思; 515206我已不愛(ài)你了; 518720我一輩子愛(ài)你; 51830我依舊想你; 520我愛(ài)你; 520x10000我愛(ài)你一萬(wàn)年; 521我愿意; 52308我愛(ài)上你啦; 52406我愛(ài)死你了; 526我餓了; 5260我暗戀你; 530我想你; 530184我想你一輩子; 5366我想聊聊; 53406我想死你了; 5376我生氣了; 53517230我想我已經(jīng)愛(ài)上你; 53719我深情依舊; 53770我想親親你; 53782我心情不好; 53880我想抱抱你; 53980我想揍扁你; 5406我是你的; 543720我是真心愛(ài)你; 54335無(wú)事想想我; 5452830無(wú)時(shí)無(wú)刻不想你; 546我輸了; 5460我思念你; 5490我去找你; 54920我始終愛(ài)你; 55646我無(wú)聊死了; 556520我不能不愛(ài)你; 5620我很愛(ài)你; 562009487我若愛(ài)你我就是白癡; 5670我要娶你; 57350我只在乎你; 57386我去上班了; 574839我其實(shí)不想走; 57410我心屬于你; 578補(bǔ)習(xí)班; 58晚安; 586我不來(lái); 584520我發(fā)誓我愛(ài)你; 587我抱歉; 592我好餓; 59420我就是愛(ài)你; 609到永久; 6120懶得理你; 6785753老地方不見(jiàn)不散; 6868溜噠溜噠; 687對(duì)不起; 7部: 70345請(qǐng)你相信我; 706起來(lái)吧; 70626請(qǐng)你留下來(lái); 706519184請(qǐng)你讓我依靠一輩子; 7086七零八落; 7087請(qǐng)你別走; 70885請(qǐng)你幫幫我; 721親愛(ài)的; 729去喝酒; 7319天長(zhǎng)地久; 740氣死你; 737420今生今世愛(ài)你; 7408695其實(shí)你不了解我; 73748096今生今世伴你左右; 745氣死我; 7474074去死去死你去死; 756辛苦了; 74839其實(shí)不想走; 765去跳舞; 7678吃飽了嗎; 770880520親親你抱抱你我愛(ài)你; 7731心心相印; 77543猜猜我是誰(shuí); 77895緊緊抱著我; 7998去走走吧;。
數(shù)字有四種寫(xiě)法:
1、中文小寫(xiě)數(shù)字:一、二、三、四、五、六、七、八、九;
2、中文大寫(xiě)數(shù)字:零、壹、貳、叁、肆、伍、陸、柒、捌、玖;
3、阿拉伯?dāng)?shù)字:0、1、2、3、4、5、6、7、8、9;
4、羅馬數(shù)字采用七個(gè)羅馬字母作數(shù)字,即Ⅰ(1)、X(10)、C (100)、M (1000),V (5)、L(50)、D (500)。
擴(kuò)展資料:
1、進(jìn)位數(shù)碼與大、小寫(xiě)數(shù)字的對(duì)照表
阿拉伯?dāng)?shù)字 :10,20,30,40,50,60,70,80,90,100
中文大寫(xiě)數(shù)字:拾,貳拾/念,叁拾,肆拾,伍拾,陸拾,柒拾,捌拾,玖拾壹佰
中文小寫(xiě)數(shù)字:十,二十/廿,三十/卅,四十/卌,五十/圩六十/圓,七十/進(jìn),八十/枯,九十/枠,一百
2、羅馬數(shù)字
(1)相同的數(shù)字連寫(xiě),所表示的數(shù)等于這些數(shù)字相加得到的數(shù),如 Ⅲ=3;
(2)小的數(shù)字在大的數(shù)字的右邊,所表示的數(shù)等于這些數(shù)字相加得到的數(shù),如 Ⅷ=8、Ⅻ=12;
(3)小的數(shù)字(限于 Ⅰ、X 和 C)在大的數(shù)字的左邊,所表示的數(shù)等于大數(shù)減小數(shù)得到的數(shù),如 Ⅳ=4、Ⅸ=9;
(4)在一個(gè)數(shù)的上面畫(huà)一條橫線,表示這個(gè)數(shù)增值 1,000 倍,如
=5000。
參考資料:搜狗百科詞條--中文數(shù)字
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:3.694秒