সংগণক যন্ত্ৰ আৰু সাংকেতিকীকৰণ পদ্ধতি

সংগণক যন্ত্ৰটোৱে আচলতে একো নাজানে। যন্ত্ৰটোক শিকাব লাগে কি কাম কৰিব লাগে, কেনেকৈ কৰিব লাগে, কেতিয়া কৰিব লাগে ইত্যাদি প্ৰতিটো কথা। এবাৰ শিকাই দিয়াৰ পিচত সংগণক যন্ত্ৰই মানুহতকৈ অধিক ক্ষিপ্ৰতাৰে আৰু মানুহতকৈ অধিক নিয়াৰিকৈ কাম সম্পন্ন কৰিব পাৰে। প্ৰথমতে আমি সংগণক যন্ত্ৰটোক যিটো কাম কৰিবলৈ শিকাম, সেই কামটোৰ প্ৰণালীবদ্ধ সমাধান ছল-সংকেত পদ্ধতিৰ সহায়ত লিখি লওঁ। অধিক জটিল সমস্যা সমাধানৰ বাবে আমি প্ৰায়ে পৰিচলন-চিত্ৰৰ সহায় লওঁ। পৰিচলন-তালিকা বা পৰিচলন-চিত্ৰ বা বোঁৱতী-তালিকা বা বোঁৱতী-চিত্ৰ ছল-সংকেত পদ্ধতিৰ চিত্ৰৰূপ। ছল-সংকেতবোৰ সংগণক যন্ত্ৰক বুজাবৰ বাবে কিছুমান কৃত্ৰিম ভাষাৰ সহায় লোৱা হয়। ক্ৰমাগত ছল-সংকেতবোৰ বৰ্ণনা কৰি সংগণক যন্ত্ৰই (লগতে আমি মানুহেও) বুজিব পৰাকৈ সংগণক ভাষাত (সংগণক যন্ত্ৰৰ ভাষা –> সংগণক ভাষা) লিখা উক্তিৰ সমষ্টিক সংগণক প্ৰ’গ্ৰেম (চুটিকৈ প্ৰ’গ্ৰেম) বোলে। আকৌ এটা বা তাতোকৈ অধিক স্বয়ংসম্পূৰ্ণ সংগণক প্ৰ’গ্ৰেমৰ সমষ্টিক ছফ্টওৱেৰ বুলি কওঁ। সংগণক যন্ত্ৰই বুজিব পৰা এই কৃত্ৰিম ভাষাবোৰক সাধাৰণতে তিনিটা বৰ্গত ভাগ কৰিব পাৰি।

১) উচ্চ বৰ্গ। উদাহৰণ- জাভা, চি, পাৰ্ল, পাইথন ইত্যাদি।

২) মধ্যম বৰ্গ। উদাহৰণ- বেচিক, ফ’ৰট্ৰান ইত্যাদি।

৩) নিম্ন বৰ্গ। উদাহৰণ- এচেমব্লি।

এতিয়া আহোঁ সাংকেতিকীকৰণ পদ্ধতিলৈ। সংগণক যন্ত্ৰই প্ৰধানতঃ সংখ্যাৰ সহায়ত আখৰ বা অন্য চিহ্নসমূহ সাঁচি থয়। অৰ্থাৎ একো একোটা সংখ্যাই একো একোটা আখৰক প্ৰতিনিধিত্ব কৰে। আমোদজনকভাৱে সংগণক যন্ত্ৰই কেৱল শূন্য আৰু এক অংক দুটাহে চিনিব বা বুজিব পাৰে অৰ্থাৎ যন্ত্ৰটোক শিকাবলৈ, বুজাবলৈ বা কিবা কৰিবলৈ আদেশ দিবলৈ হ’লে তাক আমি শূন্য আৰু একৰ কিছুমান ক্ৰমতহে ক’ব লাগিব। অৰ্থাৎ সংগণক যন্ত্ৰই মাজবাটতে আমি বুজি পোৱা আখৰসমূহ সংখ্যালৈ আৰু সংখ্যাসমূহ এক আৰু শূন্যৰ ক্ৰমলৈ সলনি কৰি লয়। উদাহৰণস্বৰূপে ইংৰাজী ‘A’ আখৰটোৰ সলনি ৬৫ আৰু ৬৫ক ১০০০০০১ লৈ সলনি কৰি লয়। গতিকে আমি ‘A’ টিপি দিলে ই ১০০০০০১ বুজি পায়। আমাৰ কাৰণে ৬৫ আৰু ১০০০০০১ একে সংখ্যা যদিও সংগণক বিজ্ঞানত এই সংখ্যাবোৰ কিছুমান মাত্ৰাত প্ৰকাশ কৰা হয়। যেনে-

১) দ্বিমূলক সংখ্যা

২) অষ্টমুলক সংখ্যা

৩) দহমুলক সংখ্যা

৪) ষোড়শমুলক সংখ্যা ইত্যাদি।

পোনপ্ৰথমতে সংগণক যন্ত্ৰ়ৰ সকলো কাম ইংৰাজী ভাষাৰ (যিহেতু ইংৰাজী এটা আন্তঃৰাষ্ট্ৰীয় ভাষা) লগত ৰিজাই কৰা হৈছিল। উদাহৰণস্বৰূপে আমি ছবি-ফলিৰ কথাই ক’ব পাৰোঁ। এতিয়া ইংৰাজীৰ বাহিৰেও আন ভাষাসমূহৰ লগতো ৰিজোৱাৰ কাম কৰি আছে সংগণক বিজ্ঞানীসকলে। জনপ্রিয় সাংকেতিকীকৰণ পদ্ধতিসমূহৰ ভিতৰত-

১) এ.এচ.চি.আই.আই. (এমেৰিকান ষ্টেন্ডাৰ্ড কোড ফৰ ইনফৰমেচন ইন্টাৰচেঞ্জৰ সংক্ষিপ্ত ৰূপ বা এচস্কী) হ’ল ইংৰাজী বৰ্ণমালাৰ ক্ৰমত ৰিজাই সজোৱা সাংকেতিকীকৰণ প্ৰক্ৰিয়া। ১৯৬০ চনত প্ৰকাশিত এই সাংকেতিকীকৰণ ক্ৰমটোৰ ভিত্তি আছিল টেলিগ্ৰাফিক সংকেত। এ.এচ.চি.আই.আই.-ৰ দুটা সংস্কৰণ আছে। এ.এচ.চি.আই.আই.-৭ আৰু এ.এচ.চি.আই.আই.-৮। ইয়াৰ প্ৰথম ৩২টা (০-৩১) সংকেট নিয়ন্ত্ৰণৰ বাবে, দ্বিতীয় ৩২টা (৩২-৬৪) সংকেত চিহ্নৰ বাবে, তৃতীয় ৩২টা সংকেত ইংৰাজী বৰফলাৰ বাবে আৰু চতুৰ্থ ৩২টা সংকেত ইংৰাজী সৰুফলা বাবে সংৰক্ষিত। সংগণক বিজ্ঞানীসকলে লিপি নিৰ্মাণৰ সময়ত অসমীয়া লিপিৰ প্ৰতিটো চিহ্ন এ.এচ.চি.আই.আই. সংকেতৰ ৩২-১২৭লৈ যিকোনো এটা সংখ্যা ৰিজাই লয়। এনেদৰে সজোৱা লিপিক এ.এচ.চি.আই.আই. লিপি বোলে।

২)আই.এচ.চি.আই.আই. (ইণ্ডিয়ান ষ্টেন্ডাৰ্ড কোড ফৰ ইনফৰমেচন ইন্টাৰচেঞ্জৰ সংক্ষিপ্ত ৰূপ বা ইচস্কী ) হ’ল সাংকেতিকীকৰণ প্ৰক্ৰিয়াত ভাৰতীয় লিখন প্ৰণালীৰ প্ৰতিনিধি। আন অৰ্থত আই.এচ.চি.আই.আই.ক আমি ব্ৰাহ্মী ভিত্তিক দহটা ভাৰতীয় লিপিৰ বৰ্ণসমূহৰ অধি-সংহতি বুলিও ক’ব পাৰোঁ । এই প্ৰণালীটোৱে সামৰি লোৱা ভাৰতীয় ভাষাৰ বিভিন্ন লিপিসমূহ হ’ল- অসমীয়া, বঙালী, দেৱনাগৰী, গুজৰাটী, গুৰুমূখী, কানাড়া, মালায়ালাম, উড়িয়া, তামিল আৰু তেলুগু।

সকলো ভাৰতীয় ভাষাৰ বৰ্ণক প্ৰতিনিধিত্ব কৰিব পৰাকৈ দহ লিপি মাৰি এক সংগণক লিপি সৃষ্টি কৰা এই উমৈহতীয়া সাংকেতিকীকৰণ প্ৰক্ৰিয়াৰ সুবিধাসমূহৰ ভিতৰত – লিপ্যান্তৰকৰণ, ভাষাৰ প্ৰযুক্তিগত দিশৰ উন্নয়ন… আদিয়েই প্ৰধান। এই সাংকেতিকীকৰণ প্ৰক্ৰিয়াৰ সাধাৰনতে দুটা সংস্কৰণ আছে। আই.এচ.চি.আই.আই.-৭ আৰু আই.এচ.চি.আই.আই.-৮। আই.এচ.চি.আই.আই.-৭ মানে ২^৭ = ১২৮ অৰ্থাৎ ইয়াৰ ০ৰ পৰা ১২৭লৈ মুঠ ১২৮টা বৰ্ণৰূপ থাকে। একেদৰে আই.এচ.চি.আই.আই.-৮ত (২^৮ = ২৫৬) ০ৰ পৰা ২৫৫লৈ মুঠ ২৫৬ টা বৰ্ণৰূপ থাকে। আই.এচ.চি.আই.আই.-৮ত ভাৰতীয় ভাষাৰ বৰ্ণৰূপৰ লগতে ইংৰাজী বৰ্ণৰূপও সন্নিহিত থাকে। ইয়াৰে প্ৰথম ১২৮টা (০ৰ পৰা ১২৭লৈ) বৰ্ণৰূপে ইংৰাজী ভাষাক আৰু দ্বিতীয় ১২৮টা (১২৮ৰ পৰা ২৫৫লৈ) বৰ্ণৰূপে ভাৰতীয় ভাষাৰ লিপিক প্ৰতিনিধিত্ব কৰে। উদাহৰণস্বৰূপে ইংৰাজী ‘A’ আখৰটো বুজাবৰ বাবে ৬৫ সংখ্যাটো, ইংৰাজী ‘B’ আখৰটো বুজাবৰ বাবে ৬৬ সংখ্যাটো সংৰক্ষিত থাকে। একেদৰে প্ৰতিটো আখৰ, প্ৰতিটো চিহ্ন বুজাবৰ বাবে একোটাকৈ সংখ্যা সংৰক্ষিত থাকে। একেদৰে ভাৰতীয় লিপিৰ প্ৰতিটো আখৰ, প্ৰতিটো চিহ্ন বুজাবৰ বাবেও একোটাকৈ সংখ্যা সংৰক্ষিত থাকে। (যেনে হিন্দী/অসমীয়া ‘অ’ বৰ্ণটোৰ বাবে ১৬৭ সংখ্যাটো, ‘খ’ বৰ্ণটোৰ বাবে ১৬৮ সংখ্যাটো ইত্যাদি)

কিন্তু আটাইতকৈ পৰিতাপৰ কথাটো হ’ল, এচস্কী, ইচস্কী বা আন সাংকেতিকীকৰন পদ্ধতিসমূহৰ ইটোৰ লগত সিটোৰ মিল নাছিল। দুটা পদ্ধতিয়ে একেটা সংখ্যাকে দুটা বেলেগ বেলেগ চিন বুজাবলৈ নাইবা একেটা চিনৰ বাবে দুটা সংখ্যা ব্যৱহাৰ কৰিব পাৰে। গতিকে এটা সংগণক যন্ত্ৰত কোনো তথ্য বেলেগ বেলেগ প্ৰণালীৰ মাজত বিচৰণ কৰোঁতে সি ভুল কৰাৰ আশংকা বেছি থাকে। অৰ্থাৎ পৃথিৱীৰ সকলো লিপি এচস্কী বা ইচস্কীৰে প্ৰকাশ কৰিব নোৱাৰি। গতিকে আমাক এনেকুৱা এটা সাংকেতিকীকৰন পদ্ধতি/মাধ্যমৰ প্ৰয়োজন হ’ল যিয়ে পৃথিৱীৰ সকলো লিপিকে সাংকেতিকভাৱে সংৰক্ষণ আৰু প্ৰকাশ কৰিব পাৰে! ইউনিক’ড হ’ল এনে এক সাংকেতিকীকৰণ মান যিয়ে এই সকলো সমস্যাৰ সমাধান কৰিছে।

৩) ইউনিক’ড: ইউনিক’ড হৈছে একক, সৰলীকৃত আৰু বিশ্বজনীন কাৰিকৰী সাংকেতিকীৰণ মান। জ’ বেকাৰ, লী কলিনচ আৰু মাৰ্ক ডেভিচ নামৰ লোক তিনিজনে ১৯৮৯ চনত একক সাংকেতিকীৰণৰ বিষয়ে কাম কৰিবলৈ আৰম্ভ কৰি ১৯৯১ চনৰ শেষৰফালে সকলো লিপি/ভাষাৰ বাবে এক সৰলীকৃত, বিশ্বজনীন মান প্ৰকাশ কৰে। পিছলৈ এই মান সকলোৱে মানি লয় আৰু তেওঁলোকৰ অপেছাদাৰী সংগঠনটো ইউনিক’ড Consortium নামৰে জনজাত হয়। পিছলৈ এই অপেছাদাৰী সংগঠনটোত বিশ্বৰ প্ৰায়বোৰ দেশৰ প্ৰতিনিধিয়ে যোগদান কৰে। তথ্য মন্ত্ৰালয়, ভাৰত চৰকাৰ হ’ল ইউনিক’ড Consortiumত আমাৰ প্ৰতিনিধি। শেহতীয়াকৈ ইউনিক’ডে বিশ্বৰ ৯৩টা লিপিৰ ১,০৭,০০০টা বৰ্ণ/চিহ্নক সামৰি লৈছে|

আমাৰ ‘ক’ আখৰটো বুজাবৰ বাবে ইউনিক’ডত ‘U+0৯৯৫’ মান়টো সংৰক্ষিত আছে। অৱশ্যে আপুনি এই মানটো অসমীয়া ‘ক’ হিচাপে ইউনিক’ডত বিচাৰি নাপায়। কাৰণ আমাৰ অসমীয়া ভাষাৰ বাবে ইউনিক’ডত সুকীয়াকৈ এটা শ্ৰেণী নাই, বঙালী ভাষাৰ লগতেই আমাক আৰু মনিপুৰী ভাষাক ৰখা হৈছে। ‘U+0৯৮0’ ৰ পৰা ‘U+0FF’ লৈ শ্ৰেণীটো বঙালী ভাষাৰ বাবে সংৰক্ষিত। অসমৰ আন এটা স্বীকৃত ভাষা বড়োকো দেৱনাগৰী লিপিৰ ভিতৰত ৰখা হৈছে। বিশ্বৰ প্ৰতিটো বৰ্ণ/চিহ্ন ইউনিক’ডে (U+এটা ষড়মাত্ৰীয় সংখ্যা)ত আৰু প্ৰতিটো লিপি/ভাষাৰ বাবে এটা নিৰ্দিষ্ট শ্ৰেণী বান্ধি দিয়া থাকে। গতিকে যিকোনো এটা ইউনিক’ড মান পালে আমি তৎক্ষনাত ক’ব পাৰো যে মানটোৱে কি বৰ্ণ/চিহ্ন বুজায়, ই কোন ভাষাৰ আৰু ইয়াৰ নাম কি।

বিশ্বজনীন বৰ্ণমালা(UCS: Universal Character Set)ৰ পৰিবৰ্ত্তিত ৰূপ(UTF: UCS Transformation Format)-ৰ আটাইতকৈ জনপ্ৰিয় সংস্কৰণটো হৈছে – ইউ. টি. এফ.-৮। বিশ্বজনীন বৰ্ণমালাৰ পৰিবৰ্ত্তিত ৰূপৰ আন সংস্কৰণবোৰৰ ভিতৰত ১) ইউ. টি. এফ. – ১ (UTF-1: UCS Transformation Format) ২) ইউ. টি. এফ. – ৪ (UTF-4: UCS Transformation Format), ৩) ইউ. টি. এফ. – ১৬ (UTF-16: UCS Transformation Format), ৪) ইউ. টি. এফ. – ৩২, (UTF-32: UCS Transformation Format) আদিয়েই প্ৰধান।

(http://noixobdo.blogspot.in)