ᲙომპიუტერებიᲡაინფორმაციო ტექნოლოგიების

Კოდირება "Unicode": ხასიათი კოდირების სტანდარტული

ყველა ინტერნეტ მომხმარებელს მცდელობა შეიქმნას ერთი ან მეორე, მისი ფუნქციის ერთხელ მაინც დაინახა ეკრანზე დაწერილი ლათინური ასოებით სიტყვა "Unicode". რა არის ეს, თქვენ შეისწავლით მიერ კითხულობს ამ სტატიაში.

განმარტება

კოდირება "Unicode" - ხასიათის კოდირების სტანდარტი. იგი მიერ შემოთავაზებული Unicode Inc. არაკომერციული ორგანიზაცია 1991 წელს. სტანდარტი განკუთვნილია ხელი შევუწყოთ უდიდესი შესაძლო რაოდენობის სხვადასხვა სახის სიმბოლოების დოკუმენტი. გვერდი, რომელიც შეიქმნა საფუძველზე მისი, შეიძლება შეიცავდეს ასოებს და სიმბოლოებს სხვადასხვა ენაზე (რუსული კორეული) და მათემატიკური ნიშნები. ამ შემთხვევაში, ყველა სიმბოლოების ხასიათი კომპლექტი ნაჩვენები უპრობლემოდ.

მიზეზები შექმნა

ერთხელ, დიდი ხნით ადრე გამოჩენა ერთიანი სისტემის "Unicode" კოდირება საფუძველზე შერჩეული პრიორიტეტები ავტორის დოკუმენტი. ამ მიზეზის გამო, ხშირად წაკითხული დოკუმენტი, საჭირო იყო, რათა გამოიყენოთ სხვადასხვა მაგიდები. ზოგჯერ აუცილებელია, რომ გავაკეთოთ რამდენჯერმე, რაც მნიშვნელოვნად ართულებს ცხოვრებას საშუალო მომხმარებლის. როგორც უკვე აღვნიშნეთ, ამ პრობლემის მოგვარების 1991 წელს მიიწვიეს Unicode Inc. არაკომერციული ორგანიზაცია, რომელიც გთავაზობთ ახალი ტიპის ხასიათის კოდირებაში. იგი განკუთვნილია გაერთიანდება მოძველებულია და სხვადასხვა სტანდარტებს. "Unicode" - კოდირების რომ ozvolila მისაღწევად წარმოუდგენელია დროს შევქმნათ ინსტრუმენტი, რომელიც მხარს უჭერს დიდი რაოდენობით სიმბოლო. შედეგი გადააჭარბა ბევრი მოლოდინი - იყო დოკუმენტები ერთდროულად შემცველი ორივე ინგლისური და რუსული ტექსტი, ლათინური და მათემატიკური გამონათქვამები.

მაგრამ შექმნის ერთიანი კოდირების წინ უძღოდა უნდა მოგვარდეს მთელი რიგი პრობლემები, რომლებიც წარმოიშვება იმის გამო, რომ დიდი ჯიშის სტანდარტები უკვე არსებული იმ დროს. ყველაზე გავრცელებული, მათ შორის:

  • Elvish წერილობით, ან "გაუგებრობა";
  • შეზღუდვები ხასიათი კომპლექტი;
  • პრობლემა გარდაქმნის codings;
  • font დუბლირებას.

მცირე ისტორიული ექსკურსი

წარმოიდგინეთ, რომ ეზოში მე -80. კომპიუტერული ტექნიკა ასე არ არის საერთო და ფორმა აქვს განსხვავებული დღეს. მიუხედავად იმისა, რომ თითოეული OS არის უნიკალური და დახვეწილი ყოველ ენთუზიასტი კონკრეტული მოთხოვნების შესაბამისად. საჭირო ინფორმაციის გაცვლა გარდაიქმნება დამატებითი rework ყველაფერი. წაკითხვის მცდელობისას დოკუმენტი ქმნის სხვა ოპერაციული სისტემა, ხშირად აჩვენებს უცნაური კომპლექტი სიმბოლოები, და თამაში იწყება კოდირება. ეს ყოველთვის არ გავაკეთოთ ეს სწრაფად, ზოგჯერ საჭირო დოკუმენტის გახსნა შეუძლებელია ექვს თვეში და კიდევ უფრო მოგვიანებით. ადამიანები, რომლებიც ხშირად ინფორმაციის გაცვლა, შექმნას საკუთარი კონვერტაციის მაგიდა. და შემდეგ მუშაობა მათ ავლენს საინტერესო დეტალი: უნდა შევქმნათ მათ ორი მიმართულებით, "ჩემი თქვენს" უკან და მეოთხე. ჩადება ბანალური inversion გამომთვლელი მანქანა არ შეუძლია, მას მარჯვენა სვეტში წყარო და მარცხენა - შედეგი, მაგრამ არა პირიქით. თუ ხედავთ, რომ საჭიროა გამოვიყენოთ რაიმე სპეციალური სიმბოლოების დოკუმენტი, მათ უნდა დაემატოს, პირველ რიგში, და მერე მეორე, და განუმარტოს პარტნიორი, რაც მან უნდა გააკეთოს, რომ ეს სიმბოლო არ გახდეს "გაუგებრობა". და მოდით ნუ დაგვავიწყდება, რომ ყველა კოდირება უნდა განვითარდეს და განახორციელოს საკუთარი შრიფტები, რამაც შექმნა დიდი რაოდენობით ეგზემპლარი OS.

წარმოიდგინეთ, უფრო, რომ შრიფტები გვერდზე, თქვენ ნახავთ 10 ცალი ერთნაირი Times New Roman მცირე შენიშვნა: UTF-8, UTF-16, ANSI, UCS-2. ახლა მესმის, რომ განვითარების უნივერსალური სტანდარტების იყო აუცილებელი?

"მამამთავარი შემქმნელები"

მიზეზებთან შექმნის Unicode უნდა ი 1987 წელს, როდესაც Dzho Bekker Xerox, ერთად Lee Collins და მარკ დევისი საწყისი Apple დაიწყო კვლევის სფეროში პრაქტიკული შექმნა უნივერსალური ხასიათი კომპლექტი. 1988 წლის აგვისტოში, Dzho Bekker გამოაქვეყნა პროექტი წინადადება შექმნის 16-bit მრავალ ენობრივი საერთაშორისო კოდირების სისტემა.

რამდენიმე თვის შემდეგ Unicode სამუშაო ჯგუფის გაფართოვდა Ken Whistler და მაიკ Kernegana ეხლა RLG, Glenn Rayt of Sun Microsystems და რამდენიმე სხვა სპეციალისტები, რაც საშუალებას აძლევს მუშაობის დასრულების წინასწარი ფორმირების საერთო კოდირების სტანდარტი.

ზოგადი აღწერა

უნიკოდის ეფუძნება კონცეფცია სიმბოლო. ამ განსაზღვრების ქვეშ ეხება აბსტრაქტული მოვლენაა, რომ არსებობს კონკრეტული ფორმით წერილობით და მიხვდა მეშვეობით grapheme (მათი "პორტრეტები"). თითოეული ხასიათი მოცემულია "Unicode" უნიკალური კოდი, რომლებიც კონკრეტული ერთეული სტანდარტი. მაგალითად grapheme B ასევე ინგლისურ და რუსული ანბანი, მაგრამ ეს შეესაბამება Unicode 2 განსხვავებული პერსონაჟები. ისინი ექვემდებარება კონვერტაციის ამას, ტ. E., რომელთაგან თითოეული აღწერს გასაღები მონაცემთა ბაზა, კომპლექტი თვისებები და სრული სახელი.

უპირატესობები Unicode

სხვა თანამედროვენი კოდირების "Unicode" არსებობს უზარმაზარი მარაგი ნიშნები "შიფრირების" სიმბოლო. ის ფაქტი, რომ მისი წინაპრები 8 ბიტი, რომ მხარს უჭერს 28 პერსონაჟი, არამედ ახალი დიზაინი უკვე 216 სიმბოლო, რომელიც იყო დიდი წინ გადადგმული ნაბიჯია. ეს დასაშვებია encode თითქმის ყველა არსებული და საერთო დამწერლობას.

მარხვის "Unicode" აღარ უნდა გამოვიყენოთ კონვერტაციის რეისები, როგორც ერთიანი სტანდარტი, ეს უბრალოდ გააბათილა სჭირდება. ასევე, მათ შორეულ წარსულს ჩაბარდა, და "გაუგებრობა" - ერთი სტანდარტი გააკეთა მათ შეუძლებელია, ისევე როგორც გამორიცხავს, რომ საჭიროა შეიქმნას დუბლიკატი შრიფტები.

განვითარების Unicode

რა თქმა უნდა, პროგრესი არ არის ადგილი, და მას შემდეგ, რაც პირველი პრეზენტაცია გავიდა 25 წელი. თუმცა, charset "Unicode" ჯიუტად ინარჩუნებს თავის პოზიციას მსოფლიოში. მრავალმხრივ ეს უკვე შესაძლებელი გახდა ის ფაქტი, რომ იგი გახდა მარტივი განხორციელება და გავრცელდა, აღიარებული დეველოპერები საკუთრების (გადახდა) და ღია პროგრამული.

ჩვენ არ უნდა ვიფიქროთ, რომ დღეს ჩვენ ვხედავთ იგივე კოდი "Unicode" როგორც მეოთხედი საუკუნის წინ. ამ ეტაპზე, იგი შეცვალა მობილური 5.h.h და ნომერი კოდირებული სიმბოლოების გაიზარდა 231. შესაძლებლობა გამოყენებით დიდი ზღვარი ნიშნები უარი მაინც შენარჩუნება მხარდაჭერა Unicode-16 (კოდირების, სადაც მაქსიმალური თანხა მათი შეზღუდული რაოდენობით 216). დაარსების დღიდან მდე ვერსია 2.0.0 "უნიკოდის სტანდარტი" გაიზარდა რაოდენობის სიმბოლოებს, რომ მასში თითქმის 2-ჯერ. შესაძლებლობები და მუდმივი ზრდა უახლოეს წლებში. იყიდება ვერსია 4.0.0 უკვე არ არის საჭირო სტანდარტის ამაღლება თავად, და რომ გაკეთდა. შედეგად, "Unicode" იპოვა ფორმა, რომელშიც ჩვენ ვიცით დღეს.

რა არის უნიკოდის?

გარდა იმისა, რომ დიდი, მუდმივად განახლდება რაოდენობის პერსონაჟი, "Unicode" -Encoding ტექსტური ინფორმაციის კიდევ ერთი სასარგებლო თვისება. ეს არის ე.წ. ნორმალიზაცია. იმის ნაცვლად, რომ გადახვევა მეშვეობით მთელი დოკუმენტი სიმბოლოს, და ჩაანაცვლებს ხატები მიმოწერა მაგიდა, გამოიყენეთ ერთი არსებული ნორმალიზაციის ალგორითმები. რა არის ეს?

ნაცვლად გაყვანაა რესურსების კომპიუტერი რეგულარული შემოწმება იგივე ხასიათი, რომელიც შეიძლება იყოს მსგავსი სხვადასხვა დამწერლობას გამოყენებით სპეციალური ალგორითმი. ეს გაძლევთ საშუალებას, რათა მსგავსი სიმბოლოები ცალკე სვეტში ძიება მაგიდაზე და ვრცელდება უკვე მათ არ დასრულებულა და კვლავ გადაამოწმოს ყველა მონაცემები.

ასეთი ალგორითმები შემუშავდა და განხორციელდა ოთხი. თითოეული კონვერტაციის ხდება მკაცრად განსაზღვრული პრინციპი, განსხვავდება სხვა, ამიტომ მოვუწოდებთ ნებისმიერი ერთი მათგანი არ არის ყველაზე ეფექტური შესაძლებელი. თითოეული განკუთვნილია კონკრეტული საჭიროებები, იყო ჩართული და წარმატებით გამოიყენება.

გავრცელება სტანდარტული

25 წლის განმავლობაში მისი ისტორია კოდირების "Unicode" მე მივიღე, ალბათ, ყველაზე გავრცელებული მსოფლიოში. ამ სტანდარტის მორგებული პროგრამების და ვებ-გვერდებზე. სიგანის პროგრამა შეიძლება მიუთითოს, რომ Unicode ახლა გამოიყენება 60% -ზე მეტი ინტერნეტ რესურსები.

ახლა, თქვენ იცით, როდესაც "Unicode" სტანდარტული გამოჩნდა. რა არის, იცით, და შეძლებენ ვაფასებთ სრული მნიშვნელობას გამოგონების მიერ ექსპერტთა ჯგუფის Unicode Inc. 25-ზე მეტი წლის წინ.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ka.birmiss.com. Theme powered by WordPress.