ᲙომპიუტერებიᲡაინფორმაციო ტექნოლოგიების

Კოდირება ტექსტის ინფორმაციას კომპიუტერული

კომპიუტერი - დახვეწილი მოწყობილობა, რომელიც შეგიძლიათ შექმნა, კონვერტაცია, და ინფორმაციის შესანახად. თუმცა, კომპიუტერი არ მუშაობს ძალიან გასაგები გზა ჩვენთვის - გრაფიკული, ტექსტური და რიცხვითი მონაცემები ინახება როგორც ორობითი კოლექტორები ნომრები. ამ სტატიაში ჩვენ განვიხილავთ, თუ როგორ კოდირების ტექსტური ინფორმაცია.

ის, რაც ჩვენთვის არის ტექსტი კომპიუტერი - თანმიმდევრობა გმირები. თითოეული სიმბოლო წარმოადგენს გარკვეული კომპლექტი zeros და პირობა. Under სიმბოლოები ნიშნავდა არა მხოლოდ ზედა და ქვედა შემთხვევაში ასო ლათინური ანბანი, არამედ პუნქტუაციის ნიშნები, არითმეტიკული ნიშნები, სპეციალური სიმბოლოების, სპეციალური სიმბოლოების და კიდევ სივრცეში.

ორობითი კოდირება ტექსტური ინფორმაცია

დაჭერით გარკვეული გასაღები შიდა კონტროლერი აგზავნის ელექტრო სიგნალი, რომ მოაქცია ორობითი კოდი. კოდექსის შესაბამისი ერთგვარი სიმბოლოა, რომელიც ეკრანზე. წარდგენა ლათინური ციფრულ ფორმატში ASCII კოდირების საერთაშორისო სისტემაში შეიქმნა. ის მოითხოვს 1 byte ჩაწერა ერთი სიმბოლო ამით შედგება რვა სიმბოლო თანმიმდევრობა zeros და პირობა. ჩაწერის ინტერვალით - დან 00000000 to 11111111, ანუ კოდირების ტექსტური ინფორმაციის გამოყენებისას სისტემა საშუალებას გვაძლევს წარმოადგენს 256 სიმბოლო. უმეტეს შემთხვევაში, ეს არ არის საკმარისი.

ASCII დაყოფილია ორ ნაწილად. პირველი 127 სიმბოლოები (from 00000000 to 01111111) საერთაშორისო და კონკრეტული სიმბოლოები და წერილები ინგლისური ანბანი. მეორე ნაწილი - გაფართოება (from 10000000 to 11111111) - განკუთვნილია წარმოადგენს ეროვნული ანბანი, წერილობით, რომელიც განსხვავდება ლათინური.

კოდირება ტექსტში ინფორმაციის ASCII აგებულია პრინციპით იზრდება თანმიმდევრობით, ანუ, დიდი რიგითი ნომერი წერილები, უფრო დიდი ღირებულება მისი ASCII კოდი. მოღვაწეები და რუსეთის ნაწილი მაგიდა აგებულია იგივე პრინციპი.

თუმცა, მსოფლიოში არსებობს რამდენიმე ტიპის კოდირების ქართულად წერილები. ყველაზე გავრცელებული - ეს არის KOI-8 (რვა ბიტიანი კოდირების, რომელიც უკვე გამოიყენება 70 პირველ ruifitsirovannyh Unix ოპერაციული სისტემა), ISO 8859-5 (შემუშავებულია სტანდარტიზაციის საერთაშორისო ბიურო), რომ CP 1251 (კოდირების ტექსტური ინფორმაცია, რომელიც გამოიყენება თანამედროვე OS Windows), ისევე როგორც 2-ბიტიანი კოდირების Unicode, რომელიც შეიძლება იქნას გამოყენებული დანერგვა 65.536 სიმბოლოებს. ასეთი მრავალფეროვანი კოდირება იმის გამო, რომ ისინი შემუშავებულია სხვადასხვა დროს, სხვადასხვა ოპერაციული სისტემების და განსხვავებული მოსაზრებები. ამის გამო, ხშირად უჭირთ, როდესაც გადაცემის ტექსტი ერთი საშუალო მეორე - შეუსაბამობაა კოდირების მომხმარებლის ნახავთ კომპლექტი გაუგებარია ხატები. როგორ შემიძლია დაფიქსირება ამ სიტუაციაში? სიტყვა, მაგალითად, მსგავსი დოკუმენტის გახსნა, გაგზავნა პრობლემებზე ტექსტის ჩვენება და გთავაზობთ რამდენიმე ვარიანტს transcoding.

ამდენად, კოდირების და დამუშავება ტექსტური ინფორმაცია კომპიუტერის ნაწლავთა - პროცესი რთული და შრომატევადი ორგანიზებული. ყველა სიმბოლო ნებისმიერი ანბანი მხოლოდ გარკვეული თანმიმდევრობა ციფრები ორობითი სისტემა, ერთ საკანში - ეს არის ერთ byte ინფორმაციას.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ka.birmiss.com. Theme powered by WordPress.