計算機數據編碼是什麼?
電腦編碼是什麼意思
電腦編碼是信息從一種形式或格式轉換為另一種形式的過程也稱為計算機編程語言的代碼簡稱編碼。用預先規定的方法將文字、數字或其它對象編成數碼,或將信息、數據轉換成規定的電脈衝信號。編碼在電子計算機、電視、遙控和通訊等方面廣泛使用。編碼是信息從一種形式或格式轉換為另一種形式的過程。解碼,是編碼的逆過程。
什麼是計算機的數字信息編碼
電腦中的數字編碼稱為二進制。不管是字符編碼還是漢字編碼,在電腦裡都是用二進制數字方式存儲的。
由於電路的複雜性因素,電腦中都使用二進制數,只有0和1兩個數碼,逢二進一,最容易用電路來表達,比如0代表電路不通,1代表電路通暢。我們平時用電腦時感覺不到它是在用二進制計算是因為電腦會把你輸入的信息自動轉換成二進制,算出的二進制數再轉換成你能看到的信息顯示到屏幕上。
一、ASCII碼。
美國信息交換標準碼是由美國國家標準學會(American National Standard Institute,ANSI)制定的,標準的單字節字符編碼方案,用於基於文本的數據。起始於50年代後期,在1967年定案。它最初是美國國家標準,供不同計算機在相互通信時用作共同遵守的西文字符編碼標準,它已被國際標準化組織(ISO)定為國際標準,稱為ISO646標準。適用於所有拉丁文字字母。
ASCII碼使用指定的7位或8位二進制數組合來表示128或256種可能的字符。標準ASCII碼也叫基礎ASCII碼,使用7位二進制數來表示所有的大寫和小寫字母,數字0到9、標點符號,以及在美式英語中使用的特殊控制字符(這裡需要特別注意:ASCII碼與標準ASCII碼的位數上的區分,標準ASCII碼是7位二進制表示)。在電腦裡,數字和字母都是用ASCII碼來存儲的,這就是為什麼一個英文字母或半角的數字、標點符號通常佔一個字節的原因。
二、漢字編碼。
電腦內部漢字信息的存儲運算的代碼有四種:輸入碼、國標碼、內碼和字型碼。
輸入碼:包括拼音編碼和字型編碼。微軟拼音ABC就是拼音編碼,五筆字型輸入法就是字型編碼。
國標碼:又稱為漢字交換碼,在計算機之間交換信息用。用兩個字節來表示,每個字節的最高位均為0,因此可以表示的漢字數為2的14次冪,就是16384個。將漢字區位碼的高位字節、低位字節各加十進制數32(即十六進制數的20),便得到國標碼。例如“中”字的國標碼為8680(十進制)或7468(十六進制)。
內碼:漢字內碼是在設備和信息處理系統內部存儲、處理、傳輸漢字用的代碼。無論使用何種輸入碼,進入計算機後就立即被轉換為機內碼。規則是將國標碼的高位字節、低位字節各自加上128(十進制)或80(十六進制)。例如,“中”字的內碼以十六進制表示時應為F4E8。這樣做的目的是使漢字內碼區別於西文的ASCII,因為每個西文字母的ASCII的高位均為0,而漢字內碼的每個字節的高位均為1。
字型碼:表示漢字字形的字模數據,因此也稱為字模碼,是漢字的輸出形式。通常用點陣、矢量函數等表示。用點陣表示時,字形碼指的就是這個漢字字形點陣的代碼。根據輸出漢字的要求不同,點陣的多少也不同。簡易型漢字為16′16點陣、提高型漢字為24′24點陣、48′48點陣等。如果是24′24點陣,每行24個點就是24個二進制位,存儲一行代碼需要3個字節。那麼,24行共佔用3′24=72個字節。計算公式:每行點數/8′行數。依此,對於48′48的點陣,一個漢字字形需要佔用的存儲空間為48/8′48=6′48=288個字節。
計算機常用的信息編碼有哪幾種
在計算機硬件中,編碼(coding)是在一個主題或單元上為數據存儲,管理和分析的目的而轉換信息為編碼值(典型的如數字)的過程。在軟件中,編碼意味著邏輯地使用一個特定的語言如C或C++來執行一個程序字符編碼:使用二進制數對字符進行的編碼稱字符編碼。
ASCII碼:美國標準信息交換碼的英文簡稱,是計算機中用二進制表示字母、數字、符號的一種編碼標準。ASCII碼有兩種,使用7位二進制數的稱為基本ASCII碼;使用8位二進制數的稱為擴展ASCII碼。
漢字編碼:用於表示漢字字符的二進制字符編碼。漢字編碼根據其用途不同可分為輸入碼、內部碼、字型碼和地址碼等。
1基本信息
編碼單位
最小的單元是位(bit),接著是字節(Byte),一個字節=8位,英語表示是1 byte=8 bits 。機器語言的單位Byte。1 KB=1024 Byte; 1 MB=1024 KB; 1 GB=1024 MB ; 1TB=1024 GB。
進制
二進制數由0和1,八進制數由0-7, 十進制數由0-9,十六進制數由0-9,A,B,C,D,E,F組成,
上層字符
字符是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。字符集是多個字符的集合,字符集種類較多,每個字符集包含的字符個數不同,常見字符集名稱:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。計算機要準確的處理各種字符集文字,需要進行字符編碼,以便計算機能夠識別和存儲各種文字。
2編碼分類
1.ASCII
ASCII(American Standard Code for Information Interchange,美國信息互換標準代碼)是基於羅馬字母表的一套電腦編碼系統,它主要用於顯示現代英語和其他西歐語言。它是現今最通用的單字節編碼系統,並等同於國際標準ISO 646。
包含內容:
控制字符:回車鍵、退格、換行鍵等。
可顯示字符:英文大小寫字符、阿拉伯數字和西文符號
ASCII擴展字符集擴展:表格符號、計算符號、希臘字母和特殊的拉丁符號。
第0~31號及第127號(共33個)是控制字符或通訊專用字符,如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BEL(振鈴)等;通訊專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;
第32~126號(共94個)是字符,其中第48~57號為0~9十個阿拉伯數字;65~90號為26個大寫英文字母,97~122號為26個小寫英文字母,其餘為一些標點符號、運算符號等。
注意:在計算機的存儲單元中,一個ASCII碼值佔一個字節(8個二進制位),其最高位(b7)用作奇偶校驗位。所謂奇偶校驗,是指在代碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正確的代碼一個字節中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個字節中1的個數必須是偶數,若非偶數,則在最高位b7添1。
2.GB2312
GB2312又稱為GB2312-80字符集,全稱為《信息交換用漢字編碼字符集·基本集》,由原中國國家標準總局發佈,1981年5月1日實施,是中國國家標準的簡體中文字符集。它所收錄的漢字已經覆蓋99.75%的使用頻率,基本滿足了漢字的計算機處理需要。在中國大陸和新加坡獲廣泛使用。
GB2312收錄簡化漢字及一般符號、序號、數字、拉丁字母、日文假名、希臘字母、俄文字母、漢語拼音符號、漢語注音字母,共 7445 個圖形字符。其中包括6763個漢字......
計算機中的數值編碼為什麼有+0和-0區別是什麼?
這是在編寫程序的時候才會碰到的一個問題,由於在程序設計語言中,有有符號整數和無符號整數之分,而有符號是的最高位是用來表示符號的,即最高位為正負號的標示位。這樣對這一個8位的數的表示法中就有這種現象了: 00000000(-0) 10000000(+0) 但是計算機把這兩種都作為0計算。這就是他在形式上的區別,其實在實際操作中是沒有什麼區別的。
希望採納
計算機數據輸入編碼實質上是什麼的過程?
編碼codec的過程
計算機數據輸入編碼的實質是什麼的過程
是可再看下的。
計算機中數據的表示、數據的存儲單位;字符、漢字及編碼分別具體指什麼?
計算機的數據存儲與數據表示?????
我知道數據的存儲有很多形式,光、磁、電……
數據表示我也知道一種很基本的形式:010110001,這種形式對應著電位的高低。
那再往後呢??像int型的i=2.那麼這個2是怎麼保存的計算機中的?保存有那些部位?在要調用時,
這個2又經歷了哪些途經才最終顯示在屏幕上??????
計算機存儲單位簡述
Bit意為“位”或“比特”,是計算機運算的基礎,屬於二進制的範籌;
Byte意為“字節”,是計算機文件大小的基本計算單位;
這兩者應用的場合不同。通常用bit來作數據傳輸的單位,因為物理層,數據鏈路層的傳輸對於用戶是透明的,而這種通信傳輸是基於二進制的傳輸。在應用層通常是用byte來作單位,表示文件的大小,在用戶看來就是可見的數據大小。比如一個字符就是1byte,如果是漢字,則是2byte。
1 kilobyte kB = 1000 (103) byte
1 megabyte MB = 1 000 000 (106) byte
1 gigabyte GB = 1 000 000 000 (109) byte
1 terabyte TB = 1 000 000 000 000 (1012) byte
1 petabyte PB = 1 000 000 000 000 000 (1015) byte
1 exabyte EB = 1 000 000 000 000 000 000 (1018) byte
1 zettabyte ZB = 1 000 000 000 000 000 000 000 (1021) byte
1 yottabyte YB = 1 000 000 000 000 000 000 000 000 (1024) byte
1 nonabyte NB = 1 000 000 000 000 000 000 000 000 000 (1027) byte
1 doggabyte DB = 1 000 000 000 000 000 000 000 000 000 000 (1030) byte
kilo (k)* = 10 ^ 3 = 1,000 thousand 千
mega (M) = 10 ^ 6 = 1,000,000 million 百萬
giga (G) = 10 ^ 9 = 1,000,000,000 billion 十億
tera (T) = 10 ^ 12 = 1,000,000,000,000 trillion 萬億
* 在公制系統中, "k" 或者 "kilo" 前綴只使用小寫字母
在計算機/通訊行業中,計算數據傳送速度也使用每秒傳送公制數據量來計算
1 bit (b) = 0 or 1 = one binary digit 一個二進制位元
1 kilobit(kb)=10^3 bits = 1,000 bits 一千位元
1 Megabit(Mb)=10^6 bits = 1,000,000 bits 一百萬位元
1 Gigabit(Gb)=10^9 bits = 1,000,000,000 bits 一萬億位元...