『壹』 計算機中目前最普遍使用的漢字字元編碼是什麼
計算機中目前最普遍使用的漢字字元編碼是ASCII碼。
ASCII 碼使用指定的7 位或8 位二進制數組合來表示128 或256 種可能的字元。標准ASCII 碼也叫基礎ASCII碼,使用7 位二進制數(剩下的1位二進制為0)來表示所有的大寫和小寫字母,數字0 到9、標點符號,以及在美式英語中使用的特殊控制字元。
奇校驗規定正確的代碼一個位元組中1的個數必須是奇數,若非薯滲孝奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個位元組中1的個數必須是偶數,若非偶數,則在最高位b7添1。
後128個稱為擴展ASCII碼。許多基於x86的系統都支持使用擴展(或「高」)ASCII。擴展ASCII 碼允許將每個字元的第8 位用於確定附加的128 個特喊顫殊符號字元、外來語字母和圖形符號。
(1)電腦里文體漢字用哪個編碼擴展閱讀:
在英語中,用128個符號編碼便可以表示所有,但是用來表示其他語言,128個符號是不夠的。比如,在法語中,字母上方有注音符號,它就無法用 ASCII 碼表示。
於是,一些歐洲國家就決定,利用位元組中閑置的最高位編入新的符號。比如,法語中的é的編碼為130(二進制10000010)。這樣一來,這些歐洲數稿國家使用的編碼體系,可以表示最多256個符號。
『貳』 計算機中目前最普遍使用的漢字字元編碼是
微型計算機中普遍使用的字元編碼是ASCII碼。
ASCII(發音:/ˈæski/ASS-kee,AmericanStandardCode forInformationInterchange,美國信息交換標准代碼)是基於拉丁字母的一套電腦編碼系統。它主要用於顯示現代英語,而其擴展版本延伸美國標准信息交換碼則可以部分支持其他西歐語言,並等同於國際標准ISO/IEC 646。
美國信息交換標准代碼是這套搭伏編碼系統的傳統命哪侍名,互聯網號碼分配局現在更傾向於使用它的新名字US-ASCII。美國信息交換標准代碼是美國電氣和電子工程師協會里程碑之一。
ASCII碼的技術背景
在計算機中,所有的數據在存儲和運算時都要使用二進制數表示。例如,像a、b、c、d這樣的52個字母(包括大寫)以及0、1等數字還有一些知緩攜常用的符號(例如*、#、@等)在計算機中存儲時也要使用二進制數來表示,而具體用哪些二進制數字表示哪個符號,這就是編碼。如果不同的計算機要想互相通信而不造成混亂,那麼每台計算機就必須使用相同的編碼規則,於是美國有關的標准化組織就推出了ASCII編碼。
『叄』 輸入漢字時所採用的編碼是
漢字輸入碼(外碼)。根據《計算機文化基礎》查詢輸入漢字時所採用的編碼是漢字輸入碼(外碼)。漢字虛中轎輸入碼也稱外碼,是為將漢字輸入到計算機設計的培神代碼。漢字輸入差肆碼種類較多,選擇不同的輸入碼方案,則輸入的方法及按鍵次數、輸入速度均有所不同。
『肆』 漢字的編碼有幾種
文字有(1)西文字元編碼。在計算機中,西文採用ASCII(American Standard Code for Information Interchange,美國信息交換標准代碼)碼表示。ASCII碼包括大小寫英文字母、標點符號、阿拉伯數字、數學符號、控制字元等共128個字元,一個ASCII碼佔一個位元組,用7位二進制數編碼組成。
(2)漢字編碼。漢字編碼包括:漢字的輸入編碼、漢字內碼和漢字字模碼。
①漢字的輸入編碼。西文可以直接通過鍵盤輸入到計算機中,而漢字則不同,要使用鍵盤輸入漢字,就必須為漢字設計相應的輸入編碼方法,如微軟拼音輸入法、五筆字型輸入法等。
②漢字內碼。不管用什麼編碼輸入漢字,每個漢字在計算機內部都由唯一的編碼~漢字內碼來表示,漢字內碼是用於漢字信息的存儲、交換、檢索等操作的機內代碼。當前的漢字編碼有二位元組、三位元組甚至四位元組的。其中GB231280(國家標准信息交換用漢字編碼,簡稱國標碼)是二位元組碼,用兩個7位二進制數編罩謹碼表示一個漢字。在計算機內蠢蘆部,漢字編碼和西文編碼是共存的,為物檔基了能夠相互區別,國標碼將兩個位元組的最高位都規定為1,而ASCII碼所用位元組的最高位為0,然後由軟體(或硬體)根據位元組最高位來判斷。
所以漢字在計算機方面,是以字形碼形式輸出的
『伍』 常用的漢字編碼是什麼
計算機常用的編碼有:ASCII碼,漢字編碼等
『陸』 電腦中的漢字都是用什麼表示的答案
目前在計算機中主要有兩種方式來表示漢字,分別是GB2312碼和big5碼.
GB2312碼是中華人民共和國國家漢字信息交換用編碼,全稱《信息交換用漢字編碼字元集--基本集》,由國家標准總局發布,1981年5月1日實施,通行於大陸.新加坡等地也使用此編碼.
GB2312收錄簡化漢字及符號、字母、日文假名等共7445個圖形字元,其中漢字佔6763個.GB2312規定"對任意一個圖形字元都採用兩個位元組表示,每個位元組均採用七位編碼表示",習慣上稱第一個字埋扒節為"高位元組",第二個位元組為"低位元組彎畢昌".GB2312-80包含了大部分常用的一、二級漢字,和9區的符號.該字元集是幾乎所有的中文系統和國際化的軟體都支持的中文字元集,這也是最基本的中文字元集.其編碼范圍是高位0xa1-0xfe,低位也是0xa1-0xfe;漢字從0xb0a1開始,結束於0xf7fe.
big5碼多用於港台地區.每個字由兩個位元組組成,其第一數蔽位元組編碼范圍為0xA1~0xF9,第二位元組編碼范圍為0x40~0x7E與0xA1~0xFE,總計收入13868個字(包括5401個常用字、7652 個次常用字、7個擴充字、以及808個各式符號).
由於GB2312編碼的字數太少,其後又對其進行過多次擴充,故產生了GB12345碼、GBK碼、GB18030碼.
Big5也作了不少擴充,如CNS11643碼.
編碼字數統計:
GB2312 6763個漢字
GB12345 6866個漢字
GBK 21003個漢字
GB18030 27000
Big5 13053
CNS11643 48,027
『柒』 在計算機中,漢字採用什麼碼存放。
機內碼。計算機只識別由0、1組成的代消知碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。 漢字交換碼(國標碼)主要用於漢字信息交換,《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個燃告漢字和682個圖形字元進行了編碼。
國標碼是漢字信息交換的標准編碼,但因其前後位元組的最高位為0,與ASCII碼發生沖突,國標碼是不可能在計算機內部直接採用的,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變。
漢字用兩個位元組表示,原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。
這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都皮橋明不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。
『捌』 計算機漢字編碼有哪些,常見的漢字編碼有哪些
1.漢字的編碼體系主要有以下幾種:國標、區位「准國標」國標是將七千餘個漢字以及標點符號、外文字母等,排成一個94行、94列的方陣。
2.方陣中每一橫行稱為一個「區」,每個區有94個「位」。
3.一個漢字在方陣中的坐標,稱為該字的區位碼。
4.GBK碼,GB碼的擴展字元森友拆編碼告殲,對多達兩萬多的簡繁漢字進行了編碼。
5.BIG5碼,針對繁體漢字的漢字編碼。
6.HZ碼,HZ碼是在Internet上廣泛使用的一種漢字編碼,它是以「純國標」的中文此棗和美標碼混用為方案。
7.UCS和ISO,10646UCS是由ISO10646定義的,是其他字元集標準的一個超集,保證和其他字元集是雙向兼容的,它包含了所有已知語言的字元。
8.Unicode提供一種統一的字元標識方法,它是16位編碼的,具備世界各地計算機和出版行業所用字元的全部代碼。
9.而且它的產生是以各個國家或國標字元編碼為基礎的。
『玖』 在計算機內,漢字採用什麼編碼表示
漢字是雙字賀念節字元,常見的編碼有gb2312,gbk,utf8.
另外還禪森困有ISO組織春悄推出的unicode