Văn bản ASCII là gì và nó được sử dụng như thế nào?

ASCII là một từ viết tắt mà Youmight đã nghe liên quan đến văn bản máy tính, nhưng đó là một thuật ngữ đang giảm nhanh chóng được sử dụng nhờ một người mới mạnh mẽ hơn. Nhưng ASCII là gì, và nó được sử dụng để làm gì?

NS 111 1101.

110 0010.

Cái miệng của một cụm từ này không thực sự cung cấp cho bức tranh hoàn chỉnh, nhưng một số phần ngay lập tức cung cấp một số manh mối, đáng chú ý là hai từ đầu tiên. ASCII là một tiêu chuẩn của Mỹ, tầm quan trọng của việc sẽ sớm trở nên rõ ràng.merican Standard Code for Information Interchange

Cái miệng của một cụm từ này không thực sự cung cấp cho bức tranh hoàn chỉnh, nhưng một số phần ngay lập tức cung cấp một số manh mối, đáng chú ý là hai từ đầu tiên. ASCII là một tiêu chuẩn của Mỹ, tầm quan trọng của việc sẽ sớm trở nên rõ ràng.

ASCII giải quyết vấn đề về cách gán giá trị cho các chữ cái và các ký tự khác để, khi chúng được lưu trữ dưới dạng các chữ cái và số 0 trong một tệp, chúng có thể được dịch trở lại thành các chữ cái khi tệp được đọc sau. Nếu các hệ thống máy tính khác nhau đồng ý về cùng một mã sử dụng, thông tin đó có thể được hoán đổi một cách đáng tin cậy.

Liên quan: Làm thế nào để tìm biểu tượng và tìm kiếm ý nghĩa của chúng

Liên quan: Làm thế nào để tìm biểu tượng và tìm kiếm ý nghĩa của chúng

Lịch sử của ASCII Đôi khi được gọi là US-ASCII, ASCII là một sự đổi mới của Mỹ được phát triển vào những năm 1960. Tiêu chuẩn đã trải qua nhiều sửa đổi kể từ năm 1977 và 1986, khi ASCII được cập nhật lần cuối.

Tiện ích mở rộng và biến thể đã được xây dựng dựa trên ASCII trong những năm qua, chủ yếu để phục vụ cho thực tế rằng ASCII bỏ qua nhiều ký tự được sử dụng hoặc thậm chí được yêu cầu, bằng các ngôn ngữ khác ngoài tiếng Anh Hoa Kỳ. ASCII thậm chí không phục vụ cho biểu tượng tiền tệ của Vương quốc Anh [£ £], mặc dù bảng Anh có mặt trong Latin-1, tiện ích mở rộng 8 bit được phát triển vào những năm 1980, mã hóa một số loại tiền khác.

ASCII đã được mở rộng và kế nhiệm bởi Unicode, một tiêu chuẩn toàn diện và đầy tham vọng hơn nhiều, được thảo luận dưới đây. Năm 2008, Unicode Overtook ASCII phổ biến cho việc sử dụng trực tuyến.

ASCII đã được mở rộng và kế nhiệm bởi Unicode, một tiêu chuẩn toàn diện và đầy tham vọng hơn nhiều, được thảo luận dưới đây. Năm 2008, Unicode Overtook ASCII phổ biến cho việc sử dụng trực tuyến.

ASCII đại diện cho nhân vật nào? Để một máy tính, chữ "A" không quen thuộc như màu tím hoặc cảm giác ghen tuông. Máy tính giao dịch trong những người và số không, và tùy thuộc vào con người để quyết định cách sử dụng những người và số không để đại diện cho số, từ, hình ảnh và bất cứ thứ gì khác.

Bạn có thể nghĩ về ASCII là mã Morse của thế giới kỹ thuật số, dù sao cũng là nỗ lực đầu tiên. Trong khi mã Morse được sử dụng để chỉ 36 ký tự khác nhau [26 chữ cái và 10 chữ số], ASCII được thiết kế để biểu thị tối đa 128 ký tự khác nhau trong 7 bit dữ liệu.

ASCII là phân biệt chữ hoa chữ thường, có nghĩa là nó đại diện cho 52 chữ in hoa và in thường từ bảng chữ cái tiếng Anh. Bên cạnh 10 chữ số giống nhau, đó là khoảng một nửa không gian được sử dụng.

Các biểu tượng chấm câu, toán học và typographic chiếm phần còn lại và bộ sưu tập các ký tự điều khiển, là mã không thể in được đặc biệt với các nghĩa chức năng-xem bên dưới để biết thêm.

Dưới đây là một số ký tự điển hình mà ASCII mã hóa:

010 0001.

Số thập phânTính cách000 1001.Tab ngang33000 1010.Dòng thức ăn480001 0111.579Kết thúc khối truyền59Kết thúc khối truyềnCòn các nhân vật khác thì sao?65ASCII đã thành công rất nhiều trong những ngày đầu của điện toán vì nó đơn giản và được áp dụng rộng rãi. Tuy nhiên, trong một thế giới với một triển vọng quốc tế hơn, một hệ thống viết sẽ không cắt nó. Truyền thông hiện đại cần phải có thể bằng tiếng Pháp, tiếng Nhật trên thực tế, bất kỳ ngôn ngữ nào chúng ta có thể muốn lưu trữ văn bản trong.Bộ ký tự Unicode có thể giải quyết tổng cộng 1.112.064 ký tự khác nhau, mặc dù chỉ khoảng một phần mười của chúng thực sự được xác định. Điều đó nghe có vẻ rất nhiều, nhưng việc mã hóa nhằm mục đích không chỉ phục vụ hàng chục ngàn ký tự Trung Quốc, nó còn bao gồm biểu tượng cảm xúc [gần một nghìn rưỡi] và thậm chí cả các hệ thống viết tuyệt chủng như Jurchen.66Liên quan: 100 biểu tượng cảm xúc phổ biến nhất được giải thíchUnicode thừa nhận sự thống trị của ASCII trong sự lựa chọn của 128 ký tự đầu tiên: chúng giống hệt như ASCII. Điều này cho phép các tệp được mã hóa ASCII được sử dụng trong các tình huống được mong đợi Unicode, cung cấp khả năng tương thích ngược.90Unicode thừa nhận sự thống trị của ASCII trong sự lựa chọn của 128 ký tự đầu tiên: chúng giống hệt như ASCII. Điều này cho phép các tệp được mã hóa ASCII được sử dụng trong các tình huống được mong đợi Unicode, cung cấp khả năng tương thích ngược.Tóm lược91Văn bản ASCII đại diện cho 26 chữ cái của bảng chữ cái tiếng Anh, với các chữ số, dấu chấm câu và một vài biểu tượng khác bị ném vào. Nó phục vụ mục đích của nó rất tốt cho phần tốt nhất của nửa thế kỷ,Bây giờ nó đã được UNICODE thay thế, hỗ trợ một số lượng lớn các ngôn ngữ và các biểu tượng khác, bao gồm cả biểu tượng cảm xúc. UTF-8 là, đối với tất cả các mục đích thực tế, việc mã hóa sẽ được sử dụng để thể hiện các ký tự Unicode trực tuyến.97"Mã để liên lạc thông tin" cho thấy chúng ta đang nói về một định dạng để truyền dữ liệu qua lại và về mặt đặc biệt, ASCII liên quan đến dữ liệu văn bản: các ký tự tạo nên các từ trong một ngôn ngữ thường có thể đọc được.ASCII giải quyết vấn đề về cách gán giá trị cho các chữ cái và các ký tự khác để, khi chúng được lưu trữ dưới dạng các chữ cái và số 0 trong một tệp, chúng có thể được dịch trở lại thành các chữ cái khi tệp được đọc sau. Nếu các hệ thống máy tính khác nhau đồng ý về cùng một mã sử dụng, thông tin đó có thể được hoán đổi một cách đáng tin cậy.98Liên quan: Làm thế nào để tìm biểu tượng và tìm kiếm ý nghĩa của chúngASCII giải quyết vấn đề về cách gán giá trị cho các chữ cái và các ký tự khác để, khi chúng được lưu trữ dưới dạng các chữ cái và số 0 trong một tệp, chúng có thể được dịch trở lại thành các chữ cái khi tệp được đọc sau. Nếu các hệ thống máy tính khác nhau đồng ý về cùng một mã sử dụng, thông tin đó có thể được hoán đổi một cách đáng tin cậy.125Lịch sử của ASCII

Lưu ý rằng các giá trị được chọn có các thuộc tính một mình, đặc biệt:

  • Các chữ cái của cùng một trường hợp luôn có thể được sắp xếp theo số lượng kể từ khi chúng theo thứ tự. Ví dụ, A có giá trị thấp hơn B, có giá trị thấp hơn Z.
  • Các chữ cái của các trường hợp khác nhau là chính xác 32. Điều này làm cho nó rất dễ dàng để dịch giữa chữ thường và chữ hoa kể từ khi chỉ cần một bit cần được chuyển cho mỗi chữ cái, một trong hai chữ cái.

Ký tự kiểm soát Khác với các chữ cái, dấu chấm câu và chữ số, ASCII có thể đại diện cho một số ký tự điều khiển, các điểm mã đặc biệt không tạo ra đầu ra một ký tự đơn nhưng thay vào đó cung cấp các ý nghĩa thay thế về dữ liệu cho bất cứ điều gì có thể đang tiêu thụ nó.

Ví dụ: ASCII 000 1001IS ký tự tab ngang. Nó đại diện cho THESPACE, bạn sẽ nhận được khi bạn nhấn phím Tab. Bạn thường không thấy các ký tự như vậy trực tiếp, nhưng hiệu ứng của chúng thường sẽ được hiển thị. Dưới đây là một số ví dụ:

Nhị phân.

Số thập phânTính cách000 1001.Tab ngang9000 1010.Dòng thức ăn10001 0111.Kết thúc khối truyền23Kết thúc khối truyền

Còn các nhân vật khác thì sao? ASCII đã thành công rất nhiều trong những ngày đầu của điện toán vì nó đơn giản và được áp dụng rộng rãi. Tuy nhiên, trong một thế giới với một triển vọng quốc tế hơn, một hệ thống viết sẽ không cắt nó. Truyền thông hiện đại cần phải có thể bằng tiếng Pháp, tiếng Nhật trên thực tế, bất kỳ ngôn ngữ nào chúng ta có thể muốn lưu trữ văn bản trong.

Bộ ký tự Unicode có thể giải quyết tổng cộng 1.112.064 ký tự khác nhau, mặc dù chỉ khoảng một phần mười của chúng thực sự được xác định. Điều đó nghe có vẻ rất nhiều, nhưng việc mã hóa nhằm mục đích không chỉ phục vụ hàng chục ngàn ký tự Trung Quốc, nó còn bao gồm biểu tượng cảm xúc [gần một nghìn rưỡi] và thậm chí cả các hệ thống viết tuyệt chủng như Jurchen.

Liên quan: 100 biểu tượng cảm xúc phổ biến nhất được giải thích

Unicode thừa nhận sự thống trị của ASCII trong sự lựa chọn của 128 ký tự đầu tiên: chúng giống hệt như ASCII. Điều này cho phép các tệp được mã hóa ASCII được sử dụng trong các tình huống được mong đợi Unicode, cung cấp khả năng tương thích ngược.

Unicode thừa nhận sự thống trị của ASCII trong sự lựa chọn của 128 ký tự đầu tiên: chúng giống hệt như ASCII. Điều này cho phép các tệp được mã hóa ASCII được sử dụng trong các tình huống được mong đợi Unicode, cung cấp khả năng tương thích ngược.

Tóm lược Văn bản ASCII đại diện cho 26 chữ cái của bảng chữ cái tiếng Anh, với các chữ số, dấu chấm câu và một vài biểu tượng khác bị ném vào. Nó phục vụ mục đích của nó rất tốt cho phần tốt nhất của nửa thế kỷ,

Bây giờ nó đã được UNICODE thay thế, hỗ trợ một số lượng lớn các ngôn ngữ và các biểu tượng khác, bao gồm cả biểu tượng cảm xúc. UTF-8 là, đối với tất cả các mục đích thực tế, việc mã hóa sẽ được sử dụng để thể hiện các ký tự Unicode trực tuyến.

"Mã để liên lạc thông tin" cho thấy chúng ta đang nói về một định dạng để truyền dữ liệu qua lại và về mặt đặc biệt, ASCII liên quan đến dữ liệu văn bản: các ký tự tạo nên các từ trong một ngôn ngữ thường có thể đọc được.

Video liên quan

Chủ Đề