Bài 2: Thông tin và dữ liệu

Nội dung lý thuyết

BÀI 2: THÔNG TIN VÀ DỮ LIỆU

1. Khái niệm về thông tin và dữ liệu

 a. Thông tin

- Những hiểu biết có được về một thực thể nào đó được gọi là thông tin về thực thể đó.

- VD: Bình cao 1.5m, nặng 50kg, học giỏi, chăm ngoan, cần cù, ...

 b. Dữ liệu

- Là những thông tin đã được đưa vào máy tính.

2. Đơn vị đo lượng thông tin

- Bit là đơn vị nhỏ nhất để đo lượng thông tin, sử dụng hai ký hiệu là 0 và 1 để biểu diễn thông tin trong máy tính.

- Các đơn vị khác để đo thông tin:

  • 1 Byte (1B) = 8 Bit
  • 1 KB (Kilôbyte) = 1024B
  • 1 MB (Mêgabyte) = 1024KB
  • 1 GB (Gigabyte) = 1024MB
  • 1 TB (Têgabyte) = 1024GB
  • 1 PB (Pêtabyte) = 1024TB

3. Các dạng thông tin

- Có thể phân loại thông tin thành hai loại: 

  • Số: số nguyên, số thực,…
  • Phi số: có ba dạng: 
    • Văn bản: báo, sách, vở, …
    • Âm thanh: tiếng nói con người, tiếng nhạc, …
    • Hình ảnh: tranh vẽ, ảnh chụp, bản đồ,…

4. Mã hóa thông tin trên máy tính

- Để máy tính xử lý được, thông tin cần phải được biến đổi thành dãy bit. Cách biến đổi như vậy gọi là mã hoá thông tin.

- Để mã hoá văn bản dùng mã ASCII (8 bit) gồm 256 ký tự được đánh số từ 0-255, số hiệu này được gọi là mã ASCII thập phân của ký tự.

- Bộ mã Unicode (16 bit) có thể mã hóa 65536 ký tự khác nhau, cho phép thể hiện trong máy tính văn bản của tất cả các ngôn ngữ trên thế giới.

5. Biểu diễn thông tin trong máy tính

 a. Thông tin loại số

* Hệ đếm:

- Bất kỳ số tự nhiên b nào lớn hơn 1 đều có thể chọn làm cơ số cho hệ đếm. Số lượng các ký hiệu được sử dụng bằng cơ số của hệ đếm đó.

- Quy tắc: giá trị của mỗi ký hiệu ở hàng bất kỳ có giá trị bằng “số hệ đếm” đơn vị của hàng kế cận bên phải.

* Hệ thập phân: là hệ dùng các số 0, 1,…,9 để biểu diễn. VD: 536,4 = 5 x 102 + 3 x 101 + 6 x 100 + 4 x 10-1

- Các hệ đếm dùng trong tin học:

  • Hệ nhị phân: là hệ chỉ dùng 2 số 0 và 1 để biểu diễn. Vd: 1102 = 1 x 22 + 1 x 2+ 0 x 20 = 610
  • Hệ cơ số 16: là hệ dùng các ký hiệu 0, 1,…,9 và A, B, C, D, E, F để biểu diễn. Trong đó: A = 10, B = 11, C = 12, D = 13, E = 14, F = 15.

Vd: A0116 = 10 x 162 + 0 x 161 + 1 x 160 = 256110

* Biểu diễn số nguyên:

- Số nguyên có dấu: bit cao nhất xác định số nguyên đó là âm (1) hay dương (0).

- Một byte biểu diễn được số nguyên trong phạm vi -127 đến 127.

- Số nguyên không âm: toàn bộ 8 bit được dùng để biểu diễn giá trị số, phạm vi từ 0 đến 256.

 

bit 7

bit 6

bit 5

bit 4

bit 3

bit 2

bit 1

bit 0

 

 

các bit cao

các bit thấp

 

* Biểu diễn số thực: Mọi số thực có thể biểu diễn được dưới dạng:  (được gọi là dấu phẩy động). Trong đó:

  • M : phần định trị             
  • K : phần bậc

Ví dụ: 12,345 = 0,12345 x 102

b. Thông tin loại phi số:

- Văn bản : để biểu diễn một xâu ký tự máy tính có thể dùng một dãy byte, mỗi byte biễu diễn một ký tự theo thứ tự từ trái sang phải. VD: biểu diễn xâu ký tự “TIN” : 01010100 01001001 01001110

- Các dạng khác: (hình ảnh, âm thanh,…) ta cũng phải mã hóa chúng thành dãy bit.

* Nguyên lí mã hóa nhị phân:

- Thông tin có nhiều dạng khác nhau như số, văn bản, hình ảnh, âm thanh… Khi đưa vào máy tính, chúng đều được biến đổi thành dạng chung – dãy bit. Dãy bit đó là mã nhị phân của thông tin mà nó biểu diễn.