এনকোডিং স্বীকৃতি। কিভাবে এনকোডিং নির্ধারণ করতে? কেন এই প্রয়োজন? এনকোডিং কি?

নির্দেশনা

আপনার কম্পিউটারে ইনস্টল করা থাকলে, টেক্সট ফাইলের এনকোডিং নির্ধারণ করতে Microsoft Office Word এডিটর ব্যবহার করুন। এই অ্যাপ্লিকেশন চালু করুন. প্রধান মেনুতে, "ফাইল" এবং "খুলুন..." নির্বাচন করুন বা Ctrl+O কী সমন্বয় টিপুন। প্রদর্শিত ডায়ালগে, পছন্দসই ডিরেক্টরিতে নেভিগেট করুন এবং ফাইলটি নির্বাচন করুন। "খুলুন" বোতামে ক্লিক করুন। CP1251 থেকে ভিন্ন হলে, কনভার্ট ফাইল ডায়ালগ স্বয়ংক্রিয়ভাবে খুলবে। এটিতে "অন্যান্য" বিকল্পটি সক্রিয় করুন এবং ডানদিকে তালিকা ব্যবহার করে এনকোডিং নির্বাচন করুন। আপনি যখন সঠিক এনকোডিং নির্বাচন করেন, তখন পাঠযোগ্য পাঠ্য "নমুনা" ক্ষেত্রে প্রদর্শিত হবে।

উৎস নির্বাচনের অনুমতি দেয় এমন পাঠ্য সম্পাদক ব্যবহার করুন। এই ধরনের একটি অ্যাপ্লিকেশনের একটি ভাল উদাহরণ হল KWrite (UNIX-এর মতো সিস্টেমে KDE পরিবেশে চলে)। পাঠ্য ফাইলটি সম্পাদকে লোড করুন। তারপরে আপনি পঠনযোগ্য পাঠ্য না দেখা পর্যন্ত কেবল এনকোডিংগুলির মধ্যে দিয়ে ঘুরুন (KWrite-এ, এটি টুল মেনুর এনকোডিং বিভাগ ব্যবহার করে করা হয়)।

একটি পাঠ্য সম্পাদকের মতো, আপনি ফাইল এনকোডিং নির্ধারণ করতে একটি ব্রাউজার ব্যবহার করতে পারেন। Mozilla Firefox ব্যবহার করুন। এই অ্যাপ্লিকেশন চালু করুন. এটি ইনস্টল করা না থাকলে, mozilla.org থেকে উপযুক্ত বিতরণ ডাউনলোড করুন এবং এটি ইনস্টল করুন। আপনার ব্রাউজারে একটি টেক্সট ফাইল খুলুন। এটি করার জন্য, প্রধান মেনুতে "ফাইল" এবং "ফাইল খুলুন..." আইটেমগুলি নির্বাচন করুন বা Ctrl+O টিপুন। লোড করা পাঠ্যটি সঠিকভাবে প্রদর্শিত হলে, "দেখুন" মেনুর "এনকোডিং" বিভাগটি প্রসারিত করুন এবং চেক করা আইটেমের নাম থেকে এনকোডিংটি খুঁজে বের করুন৷ অন্যথায়, একই মেনু থেকে বিভিন্ন আইটেম নির্বাচন করে এই বিকল্পটি নির্বাচন করুন, সেইসাথে এটির "উন্নত" বিভাগ।

টেক্সট ফাইলের এনকোডিং নির্ধারণ করতে বিশেষ ইউটিলিটি ব্যবহার করুন। UNIX-এর মতো সিস্টেমে আপনি enca ব্যবহার করতে পারেন। প্রয়োজনে উপলব্ধ প্যাকেজ ম্যানেজার ব্যবহার করে এই প্রোগ্রামটি ইনস্টল করুন। কমান্ডটি চালানোর মাধ্যমে উপলব্ধ ভাষাগুলির তালিকা করুন:

enca --তালিকাভুক্ত ভাষা

টেক্সট ফাইলের এনকোডিং নির্দিষ্ট করুন এর নাম -g বিকল্প ব্যবহার করে এবং নথির ভাষা -L বিকল্প ব্যবহার করে উল্লেখ করে। উদাহরণ স্বরূপ:

enca -L রাশিয়ান -g /home/vic/tmp/aaa.txt.

সূত্র:

  • ASCII টেক্সট এনকোডিং

আপনি যদি নিজের ব্লগ তৈরি করার সিদ্ধান্ত নেন, তাহলে আপনি আপনার পৃষ্ঠায় ডিজাইন ছাড়া করতে পারবেন না। আপনি একটি পছন্দের মুখোমুখি হয়েছেন: একটি ভাল টেমপ্লেট কিনুন বা ইন্টারনেট থেকে একটি বিনামূল্যের টেমপ্লেট ডাউনলোড করুন। অবশ্যই, একজন নবীন ওয়েবমাস্টারের জন্য, একটি বিনামূল্যের টেমপ্লেট হাতে থাকা টাস্কের একটি চমৎকার সমাধান। কিন্তু এই টেমপ্লেটগুলির একটি বড় অসুবিধা রয়েছে: এগুলি এমন একজন ব্যক্তির দ্বারা তৈরি করা হয়েছে যিনি সর্বদা টেমপ্লেটের ভিতরে তার ওয়েবসাইটের ঠিকানা সন্নিবেশ করেন৷ কখনও কখনও এই অসুবিধা সংশোধন করা যেতে পারে, কিন্তু এনকোড করা ফাইল এম্বেড করা সাইটের ঠিকানা অপসারণ করা এত সহজ নয়।

আপনার প্রয়োজন হবে

  • ওয়ার্ডপ্রেসে এনকোড করা ফাইল সম্পাদনা করা।

নির্দেশনা

আপনি যদি আপনার পৃষ্ঠায় লেখকের ওয়েবসাইটের একটি লিঙ্ক দেখতে পান তবে ফাইলগুলিতে অনুসন্ধানটি পছন্দসই ফলাফল দেয় না, এটি কিছু ফাইলে এনকোড করা হয়েছিল। আপনি প্রথমবার এই ধরনের একটি লিঙ্ক খুঁজে পেতে সক্ষম হবে না. এটি নিম্নলিখিত ফর্ম নিতে পারে: "" তবে অতিরিক্ত প্লাগইনগুলি আপনাকে লিঙ্কগুলির সাথে মোকাবিলা করতে সহায়তা করবে, উদাহরণস্বরূপ ওয়ার্ডপ্রেসের জন্য TAC প্লাগইন৷ এটি আপনাকে সেই লিঙ্কগুলি খুঁজে পেতে দেয় যা এনকোড করা যেতে পারে। এই প্লাগইনের সাহায্যে আপনি এনক্রিপ্ট করা ফাইলগুলিও সম্পাদনা করতে পারেন৷

কখনও কখনও আপনি যখন একটি টেক্সট ফাইল খোলার চেষ্টা করেন, তখন আপনি প্লেইন টেক্সটের পরিবর্তে অদ্ভুত অক্ষরের একটি সেট দেখতে পান। এর মানে হল যে, সম্ভবত, ফাইলের মূল এনকোডিং পরিবর্তন করা হয়েছে। এই ধরনের পরিস্থিতিতে, এটি দুবার চেক করা প্রয়োজন এবং প্রয়োজনে সঠিকটির সাথে প্রতিস্থাপন করা উচিত। এর পরে, পাঠ্য ফাইলটি আবার পাঠযোগ্য হবে।

আপনার প্রয়োজন হবে

  • - কম্পিউটার;
  • - Stirlitz প্রোগ্রাম.

নির্দেশনা

পরবর্তী ক্রিয়াগুলির জন্য আপনার Stirlitz প্রোগ্রামের প্রয়োজন হবে। অ্যাপ্লিকেশনটি সহজেই ইন্টারনেটে পাওয়া যাবে। এটি ডাউনলোড করুন (আর্কাইভে ডাউনলোড করা হয়েছে)। যেকোনো ফোল্ডারে আর্কাইভ আনজিপ করুন। প্রোগ্রাম ইনস্টল করার কোন প্রয়োজন নেই. আপনি ফোল্ডার থেকে সরাসরি এটি চালাতে পারেন।

প্রোগ্রাম শুরু করার পরে, আপনি নিজেকে প্রধান মেনুতে পাবেন। উইন্ডোর উপরের বাম কোণে, "ফাইল" কমান্ডে ক্লিক করুন। তারপর "ওপেন" কমান্ডটি নির্বাচন করুন। একটি ওভারভিউ উইন্ডো প্রদর্শিত হবে। এই উইন্ডোতে আপনাকে সেই ফাইলটির পাথ নির্দিষ্ট করতে হবে যার জন্য আপনি উৎস এনকোডিং খুঁজে বের করতে চান। বাম মাউস বোতাম ব্যবহার করে ফাইলটি নির্বাচন করুন। এর পরে, উইন্ডোর নীচে "খুলুন" ক্লিক করুন। নথির বিষয়বস্তু প্রোগ্রামের প্রধান মেনু উইন্ডোতে প্রদর্শিত হবে।

এরপরে, প্রোগ্রাম মেনু থেকে "সম্পাদনা" উপাদান নির্বাচন করুন। এর পরে, অতিরিক্ত মেনুতে, "ডিকোড" এ ক্লিক করুন। ফাইল ডিকোডিং পদ্ধতি শুরু হবে। একটি নিয়ম হিসাবে, এর সময়কাল দশ সেকেন্ডের বেশি হয় না। অপারেশন সম্পন্ন হওয়ার পরে, পাঠযোগ্য পাঠ্য প্রোগ্রাম উইন্ডোতে বোধগম্য অক্ষরের পরিবর্তে উপস্থিত হওয়া উচিত। প্রোগ্রাম মেনুর শীর্ষে বর্তমান ফাইলের এনকোডিং সম্পর্কে তথ্য থাকা উচিত।

আপনি যদি একটি নথিকে একটি ভিন্ন বিন্যাসে এনকোড করতে চান তবে এটিও বেশ সহজ। টুলবারের শীর্ষে বিভিন্ন কোডের তালিকা রয়েছে। নথিটি প্রস্তুত হলে, আপনাকে যা করতে হবে তা হল কোডটি নির্বাচন করুন এবং এটিতে বাম-ক্লিক করুন। কয়েক সেকেন্ড পরে, নথি এনকোডিং পরিবর্তন করা হবে। যদি অদ্ভুত অক্ষরগুলি আবার উপস্থিত হয়, এর অর্থ হল এই কোডটি বর্তমান নথির সাথে মানানসই নয় এবং আপনার অন্য একটি বেছে নেওয়া উচিত।

বিষয়ের উপর ভিডিও

সহায়ক পরামর্শ

প্রয়োজনে, আপনি সরাসরি প্রোগ্রামে ডকুমেন্টের বিষয়বস্তু পরিবর্তন করতে পারেন, যেহেতু Stirlitz-এর ভাল সম্পাদনার ক্ষমতা রয়েছে।

সূত্র:

  • ASCII টেক্সট এনকোডিং

আধুনিক ওয়েব পৃষ্ঠাগুলি বেশিরভাগ ইউনিকোড ব্যবহার করে। কিন্তু কিছু সম্পদ অনেক আগে তৈরি করা হয়েছিল এবং তারপর থেকে আর কখনও আধুনিকীকরণ করা হয়নি। উপরন্তু, এমনকি একটি আধুনিক সাইট দেখার সময়, ব্রাউজার ভুলভাবে এনকোডিং নির্ধারণ করতে পারে।

নির্দেশনা

এটা সম্ভব যে স্বয়ংক্রিয় এনকোডিং সনাক্তকরণ ঘটনাক্রমে ব্রাউজারে অক্ষম করা হয়েছে৷ এটি চালু করার চেষ্টা করুন। এটি করার জন্য, মেনুতে সাব-আইটেম "দেখুন" - "এনকোডিং" (অপেরার পুরানো সংস্করণগুলির পাশাপাশি অন্যান্য অনেক ব্রাউজারে) বা "পৃষ্ঠা" - "এনকোডিং" (অপেরার নতুন সংস্করণগুলিতে) নির্বাচন করুন। মোডটি চালু করুন, যাকে বলা যেতে পারে "স্বয়ংক্রিয়" বা "স্বয়ংক্রিয়ভাবে নির্বাচন করুন"। সম্ভবত এর পরে পৃষ্ঠার পাঠ্য অবিলম্বে পাঠযোগ্য হয়ে উঠবে।

পৃষ্ঠা প্রদর্শন স্বাভাবিক না হলে, সঠিক এনকোডিং ম্যানুয়ালি খুঁজুন। এটি করার জন্য, পূর্ববর্তী ক্ষেত্রের মতো একই মেনু সাব-আইটেমে যান, তবে স্বয়ংক্রিয় মোডের পরিবর্তে, KOI-8R এনকোডিং নির্বাচন করুন - ইউনিকোডে স্থানান্তরের আগে তৈরি করা সাইটগুলিতে এটি প্রায়শই পাওয়া যায়। ব্যর্থ হলে, CP1251, CP866 এনকোডিং নির্বাচন করতে একই পদ্ধতি ব্যবহার করার চেষ্টা করুন এবং যদি এটি সাহায্য না করে তবে "সিরিলিক" বিভাগ থেকে অন্যান্য সমস্ত মান চেষ্টা করুন।

একটি পৃষ্ঠার এনকোডিং সম্পর্কে তথ্য সাধারণত এর উত্স কোডে সংরক্ষণ করা হয় এবং এটি এই ডেটার ভিত্তিতে ব্রাউজার এটি নির্ধারণ করে। পৃষ্ঠার উত্স কোড পড়তে, ব্রাউজারের উপর নির্ভর করে মেনু থেকে নির্বাচন করুন, আইটেম "দেখুন" - "উৎস কোড" বা "পৃষ্ঠা" - "উন্নয়ন সরঞ্জাম" - "উৎস কোড"। টেক্সটের একেবারে শুরুতে, এইরকম একটি লাইন খুঁজুন: মেটা http-equiv="Content-Type" content="text/html; charset=encodingname", যেখানে encodingname হল এনকোডিংয়ের নাম। তারপর ব্রাউজার মেনুতে এই এনকোডিং নির্বাচন করুন।

স্ট্যান্ডার্ড ব্রাউজার টুল শক্তিহীন হয় যদি একটি কম সাধারণ এনকোডিং ব্যবহার করা হয়, বা পাঠ্যটি বারবার পুনঃকোডিংয়ের শিকার হয়। এটি ডিক্রিপ্ট করতে, একটি ডিকোডারে যান, উদাহরণস্বরূপ, http://www.artlebedev.ru/tools/decoder/। ইনপুট ক্ষেত্রে পৃষ্ঠা থেকে পাঠ্যের একটি অংশ রাখুন এবং "ট্রান্সক্রাইব" বোতামে ক্লিক করুন। এটি করার জন্য, মাউস দিয়ে পাঠ্য নির্বাচন করুন, Ctrl+C টিপুন, ইনপুট ক্ষেত্রে যান এবং Ctrl+V টিপুন। সফল হলে, ডিক্রিপ্ট করা পাঠ্যের সাথে আপনি এটি কী এনকোডিং এ ছিল সে সম্পর্কে তথ্য পাবেন।

    ব্রাউজারে, আপনি হাইপারটেক্সট ল্যাঙ্গুয়েজ HTML এর সোর্স কোড খুলবেন এবং আপনি এই ট্যাগটি খুঁজে পাবেন।

    lt;meta http-equiv=Content-Type content=text/html; charset=windows-1251 />

    পৃষ্ঠা এনকোডিং: windows-1251 সিরিলিক

    আমি অনুমান হ্যাঁ. আপনি পৃষ্ঠার উত্স কোড ফোকাস করতে পারেন. কিন্তু এনকোডিং তথ্য সহ মেটা ট্যাগ বিভিন্ন পৃষ্ঠায় একটু ভিন্নভাবে লেখা হয়। অতএব, আপনি সোর্স কোডে অক্ষরসেট শব্দটি অনুসন্ধান করতে পারেন। (কখনও কখনও কোডটি পড়া বেশ কঠিন হতে পারে, তাই অনুসন্ধান ফাংশনটি ব্যবহার করা বোধগম্য হয়।)

    এছাড়াও, আপনি কোন ব্রাউজার ব্যবহার করেন তার উপর নির্ভর করে, আপনি ব্রাউজার মেনু থেকে এনকোডিং তথ্য দেখতে পারেন। এখানে অপেরা এবং ফায়ারফক্সের স্ক্রিনশট রয়েছে।

    • পৃষ্ঠা ক্ষেত্রে ডান ক্লিক করুন

    • প্রদর্শিত মেনুতে, পেজ সোর্স কোড নির্বাচন করুন

    • একটি উইন্ডো আমাদের সামনে বিভিন্ন কোড ইত্যাদিতে খোলে। আমরা লাইন পেজ এনকোডিং খুঁজে পাই। নিচের স্ক্রিনশট।

    বর্ধিত সংস্করণ:

  • একটি সাইটের এনকোডিং সম্পর্কে তথ্য প্রাপ্ত করা আসলে বেশ সহজ হবে; এটি করার জন্য, আপনাকে কেবল দুটি কীগুলির সংমিশ্রণ টিপতে হবে। তাই, শুধু CTRL plus U একসাথে চেপে ধরে রাখুন।এর পর সোর্স কোডটি আপনার সামনে আসবে।

    একটি সাইটের এনকোডিং খুঁজে বের করা খুবই সহজ; আপনাকে যা করতে হবে তা হল আপনার ব্রাউজারে ইংরেজি CTRL+U কী সমন্বয় টাইপ করুন এবং ইন্টার চাপুন, সাইটের উত্স কোডটি আপনার সামনে উপস্থিত হবে, উদাহরণস্বরূপ.. ..charset=utf-7, শেষ হওয়া utf-7 হল সাইটের উৎস এনকোডিং।

    সাইট এনকোডিং খুঁজে বের করুনকরতে পারা.

    যে কোনো ইন্টারনেট পৃষ্ঠা খোলা হয়, CTRL+U টিপুন।

    নিম্নলিখিত উইন্ডো প্রদর্শিত হবে:

    উইন্ডোতে, ভিউ - এনকোডিং-এ ক্লিক করুন এবং নির্দিষ্ট সাইট এনকোডিং সহ একটি উইন্ডো খুলবে।

    যদিও এটি ঘটে যে আপনি সাইটের এনকোডিং খুঁজে বের করতে পারবেন না।

    সাইট এনকোডিং জানতে ইচ্ছাঅনেক মানুষের ঘটবে না। একটি নিয়ম হিসাবে, এই ইচ্ছাটি উদ্ভূত হয় যখন পাঠ্যের পরিবর্তে পৃষ্ঠায় অদ্ভুত অক্ষরগুলি উপস্থিত হয়। অথবা এমন ক্ষেত্রে যেখানে আপনাকে একটি ওয়েবসাইট সেট আপ করতে হবে।

    সাইট এনকোডিং খুঁজে বের করতে, আপনি পৃষ্ঠায় ডান-ক্লিক করতে পারেন, পৃষ্ঠা উত্স কোড নির্বাচন করুন এবং অক্ষর সেট প্যারামিটারের জন্য কী মান সেট করা আছে তা দেখতে কোডের শীর্ষে দেখুন (আপনি এটি একটি অনুসন্ধানের মাধ্যমে খুঁজে পেতে পারেন)।

    একটি সাইটের এনকোডিং খুঁজে বের করার একটি আরও সহজ উপায় হল ব্রাউজার মেনুতে ভিউ নির্বাচন করা, তারপর এনকোডিং এবং ডিফল্টরূপে ব্রাউজারে কী এনকোডিং সেট করা আছে তা দেখুন৷ সাধারণত এটি সাইটের এনকোডিংয়ের সাথে মেলে।

  • সাইট এনকোডিং

    সাইট এনকোডিং খুঁজে বের করার বিভিন্ন উপায় আছে

    • 1 উপায়। বিভিন্ন ব্রাউজারের জন্য ভিন্ন হতে পারে। অপেরার জন্য - প্রধান মেনুতে যান, পৃষ্ঠা আইটেমটি খুঁজুন, তারপর এনকোডিং, এটিতে নির্দেশ করুন এবং আপনি পৃষ্ঠা এনকোডিং খুঁজে পাবেন।
    • পদ্ধতি 2। যেকোনো ব্রাউজারে, CTRL+U চাপুন, তারপরে আমরা সাইটের সোর্স কোড দেখতে পাব, lt;meta http-equiv=Content-Type content=text/html; অক্ষর সেট = utf-8. utf-8 সোর্স এনকোডিং হবে।
  • পৃষ্ঠার যেকোনো জায়গায় ডান মাউস বোতামে ক্লিক করুন। দেখুন কোড নির্বাচন করুন। তারপর Ctrl + F টিপুন এবং পৃষ্ঠার এনকোডিং নির্দেশিত কোডের অংশ খুঁজে পেতে সামগ্রী লিখুন। আপনি স্ক্রিনশটে দেখতে পাচ্ছেন, এই পৃষ্ঠাটি Windows-1251 এনকোডিং-এ সেট করা আছে।

প্রতিটি প্রোগ্রাম বিশেষ কোড ব্যবহার করে লেখা হয়, যা প্রোগ্রামিংয়ের একটি মৌলিক অংশ। আজ আমরা একটি নির্দিষ্ট প্রোগ্রাম লেখা হয়েছে যে এনকোডিং নির্ধারণ করতে কিভাবে সম্পর্কে কথা বলতে হবে.

এনকোডিং কি?

একটি এনকোডিং (একটি প্রোগ্রামিং ভাষার একটি অংশ) সংখ্যা এবং অক্ষরের একটি নির্দিষ্ট ক্রমিক সেট, যার জন্য আপনি নতুন ফাইল এবং প্রোগ্রাম তৈরি করতে পারেন। এটি প্রতিটি প্রোগ্রামিং ভাষার একটি মৌলিক উপাদান এবং মূল সংস্করণকে রূপান্তর করে যেকোনো প্ল্যাটফর্মে অভিযোজিত করা যেতে পারে। সম্পূর্ণ লেখার পরে, এনকোডিং নির্ধারণ করা প্রায় অসম্ভব বা এমনকি খুব কঠিন; এটি কোন প্রোগ্রামগুলির সাথে লেখা হয়েছিল তার উপর নির্ভর করে। প্রোগ্রামিং-এ এনকোডিংকে অন্যান্য প্রোগ্রামে এর প্রতিরূপের সাথে বিভ্রান্ত করা উচিত নয়, যা কেবলমাত্র নির্দিষ্ট তথ্য বা এর কিছু অংশ এনক্রিপ্ট করে।

কিভাবে ফাইল এনকোডিং নির্ধারণ করতে হয়

একটি প্রোগ্রামিং ভাষাকে শুধুমাত্র দুটি ক্ষেত্রে চিনতে হবে: প্রথমত, যখন এটি প্রোগ্রামে যোগ করা বা রিমেক করার প্রয়োজন হয়; দ্বিতীয়ত, যখন আপনাকে বিদ্যমান একটির সম্পূর্ণ বিপরীত সংস্করণ লিখতে হবে। এটি পরামর্শ দেওয়া হয় যে একই বিশেষজ্ঞ এই সমস্ত কিছুর সাথে মোকাবিলা করেন, তবে যদি এটি সম্ভব না হয় তবে আপনার এনকোডিং কীভাবে নির্ধারণ করা যায় সে সম্পর্কে জ্ঞান থাকা উচিত।

প্রোগ্রাম

আপনি একটি নির্দিষ্ট সংখ্যক প্রোগ্রাম ব্যবহার করে এনকোডিং নির্ধারণ করতে পারেন। আসুন তাদের সম্পর্কে কথা বলি। এর মধ্যে একটি হল Stirlitz প্রোগ্রাম। তিনি শুধুমাত্র এনকোডিং নির্ধারণ করতে সক্ষম হবেন না, তবে ডেটা পরিবর্তন করার জন্য প্রয়োজনীয় কোডও নির্বাচন করবেন। নোটপ্যাড++ও একটি ভালো প্রোগ্রাম। এটির সাহায্যে, আপনি মাত্র পাঁচ থেকে দশ মিনিটের মধ্যে আপনার প্রয়োজনীয় ফাইলের আকারের উপর নির্ভর করে বিশ্লেষণ করতে পারেন। প্রোগ্রামটির একটি বিশেষ বৈশিষ্ট্য হল এটি প্রয়োজনীয় নথিগুলিকে বিভিন্ন প্রোগ্রামিং ভাষায় রূপান্তর করতে পারে এবং সেগুলিকে এই ফর্মটিতে সংরক্ষণ করতে পারে। এরপরে রয়েছে আল্ট্রাএডিট প্রোগ্রাম, যা কেবল ফাইল এনকোডিং সনাক্ত করবে না, তবে এটি রূপান্তর করতেও সক্ষম হবে। এর বিশেষত্ব হল এটি শুধুমাত্র প্যাকেজটিকেই নয়, আলাদাভাবে এর পাঠ্যকেও এনকোড করে। কিছু নথি এনকোডিং নিজেদের দেখাতে পারে। এটি করার জন্য, নথির শর্টকাটটি খুলুন, "এনকোডিং" ফাংশনটি নির্বাচন করুন এবং দেখুন এই ফাইলটি আপনাকে কী দেয়। যদি সম্পাদক ভাল হয়, তাহলে তিনি বর্তমান কোড পরিবর্তন করতে সক্ষম হবেন, বিভিন্ন প্রোগ্রামিং ভাষার জন্য প্যাকেজ রূপান্তর করতে পারবেন। অন্যান্য প্রোগ্রাম রয়েছে যার উদ্দেশ্য হল ফাইলগুলিকে এনকোড করা, সেগুলিকে রূপান্তর করা এবং একটি ফাইলকে একই সময়ে বেশ কয়েকটি প্রোগ্রামিং ভাষায় মানিয়ে নেওয়ার ক্ষমতা, তবে আমরা শুধুমাত্র সেগুলিই সরবরাহ করেছি যেগুলির সাথে কাজ করার জন্য শুধুমাত্র মৌলিক দক্ষতা প্রয়োজন।

এর সারসংক্ষেপ করা যাক

এই নিবন্ধটির জন্য ধন্যবাদ, আপনি এনকোডিং কী, কোথায় এবং কেন এটি ব্যবহার করা হয় এবং আপনি কীভাবে এটি চিনতে পারেন সে সম্পর্কে শিখেছেন। আমরা কথোপকথনের উপর কিছুটা স্পর্শ করেছি যে একটি এনকোডিং প্রোগ্রাম একটি ফাইলের কোড পরিবর্তন করতে পারে, এটিকে বিভিন্ন প্রোগ্রামিং ভাষায় মানিয়ে নিতে পারে।

প্রকৃতপক্ষে, এনকোডিং নির্ধারণের জন্য 2টি ইউটিলিটি রয়েছে। প্রথমটি হল ফাইল। এটি ফাইলের ধরন এবং ইউনিকোড এনকোডিংগুলি ভালভাবে সনাক্ত করে... কিন্তু ASCII এনকোডিংয়ের সাথে এটি বগি। উদাহরণস্বরূপ, সেগুলিকে উপস্থাপন করা হয়েছে যেন তারা ISO-8859-1। কিন্তু তা সত্য নয়। এখানে আপনাকে আরেকটি ইউটিলিটি, enca ব্যবহার করতে হবে। ফাইলের বিপরীতে, এটি ASCII এনকোডিংয়ের সাথে খুব ভাল কাজ করে। আমি এমন একটি ইউটিলিটি সম্পর্কে জানি না যা একই সময়ে ASCII এবং ইউনিকোড উভয়ের সাথেই ভাল কাজ করে... তবে আপনি নিজের লেখার মাধ্যমে তাদের একত্রিত করতে পারেন। এটা সত্যি. উপায় দ্বারা, enca এছাড়াও recode করতে পারেন. কিন্তু আমি আপনাকে এটি করার পরামর্শ দিচ্ছি না। কারণ সবচেয়ে ভালো জিনিস হল iconv. এটি সমস্ত ধরণের এনকোডিং এবং এমনকি আরও অনেক কিছুর সাথে পুরোপুরি কাজ করে, EBCDIC এর মতো BCD এনকোডিং সহ (এগুলি 70-80 এর এনকোডিং, এমনকি DOS এর আগেও...) যদিও সেই সিস্টেমগুলি অনেক আগেই চলে গেছে, এবং প্রচুর পরিমাণে আছে ফাইলের... আমি আইকনভের চেয়ে রিকোডিংয়ের জন্য ভাল কিছু জানি না। আমি এখনও মনে করি যে ফাইলটি ASCII এনকোডিংগুলি সনাক্ত করে না কারণ এই এনকোডিংয়ের জন্য সংশ্লিষ্ট মাইম-টাইপগুলি নিবন্ধিত নয়... এটি খারাপ৷ কারণ সেরা এনকোডিং হল ASCII।
এই জন্য অনেক কারণ আছে। এবং আমি একটি যুক্তিসঙ্গত কারণ জানি না কেন ইউনিকোড ব্যবহার করা উচিত, "ইউএসএ তাই সিদ্ধান্ত নিয়েছে..." বাক্যাংশটি ছাড়া এবং তারা সেগুলি সবার উপর চাপিয়ে দেয়, বিশেষ করে এই UTF-8। এটি সর্বকালের সবচেয়ে খারাপ পাঠ্য এনকোডিং অভিজ্ঞতা! এবং utf-8 ব্যবহার না করার মূল কারণ, কিন্তু ASCII ব্যবহার করার জন্য অন্য কিছু ব্যবহার করা কখনই অর্থপূর্ণ নয়। এমনকি ওয়েবে। ব্যাজ চান? অক্ষর ফন্ট ব্যবহার করুন, তাদের প্রচুর আছে. আমি কোন সমস্যা দেখছি না... আমি কেন কোরিয়ান, আরব বা চাইনিজদের জন্য এটা করব? চাই না। রাশিয়ান, বা অন্তত ইংরেজি, সবসময় আমার জন্য যথেষ্ট ছিল। কেন আমি তাদের নোংরা ভাষা এবং এনকোডিং প্রয়োজন? এখন ASCII সম্পর্কে। KOI8-R একটি অভিনব এনকোডিং। সেখানে রাশিয়ান অক্ষর ক্রমানুসারে নেই। শুধুমাত্র 2টি সাধারণ আছে: CP1251 এবং DOS866। কি জন্য উপর নির্ভর করে. যদি গ্রাফিক্সের জন্য, তাহলে অবশ্যই CP1251। এবং যদি পূর্ণাঙ্গ সিউডো-গ্রাফিক্সের জন্য, তবে তারা DOS866 এর চেয়ে ভাল সমাধান নিয়ে আসেনি। তারা নিখুঁত নয়, কিন্তু প্রায়... রাশিয়ান পাঠ্যের জন্য utf-8 এর খারাপ জিনিস হল যে প্রতিটি অক্ষর 2 বাইট নেয়। এমন একটি বৈশিষ্ট্যও রয়েছে যেমন সমস্ত ইউনিকোডে এটি ভারতীয়... এটি এমন একটি ক্রম যেখানে বাইটগুলি যায়, প্রথমে সর্বনিম্ন তাৎপর্যপূর্ণ এবং তারপরে সবচেয়ে তাৎপর্যপূর্ণ (যেমন ঠিকানা দ্বারা স্মৃতিতে, বা লেখার সময় শব্দে অক্ষর) বা তদ্বিপরীত, একটি সংখ্যার অঙ্কগুলির মতো, প্রথমে সবচেয়ে উল্লেখযোগ্য এবং তারপর ছোটগুলি৷ এবং যদি প্রতীকটি 3, 4 বা তার বেশি বাইট হয় (UTF-8-এ 16 পর্যন্ত), তাহলে সমস্যার সংখ্যা দ্রুত বৃদ্ধি পায়! এটিও ধীর হয়ে যায়, কারণ প্রতিবার আপনাকে একটি জটিল অ্যালগরিদম ব্যবহার করে অক্ষরের দৈর্ঘ্য গণনা করতে হবে! কিন্তু আমাদের এসবের কোনো দরকার নেই! তদুপরি, মনে রাখবেন যে তাদের ইংরেজি অক্ষরগুলি ক্রমানুসারে রয়েছে, কিছুই অনুপস্থিত এবং সবকিছুই 1ম বাইটে ফিট করে... অর্থাৎ। এগুলি কৃত্রিমভাবে উদ্ভাবিত জিনিস যা অভিজাত আমেরিকানদের জন্য নয়। তারা মোটেও পাত্তা দেয় না। তারা টেবিলের শুরুতে তাদের বর্ণমালা লিখে একসাথে সমস্ত সমস্যা বাইপাস করেছে! কিন্তু তাদের এই অধিকার কে দিয়েছে? এবং অন্য সবাই জাহান্নামে চালিত হয়েছিল... বিশেষ করে চীনারা! কিন্তু আপনি যদি CP1251 ব্যবহার করেন, তাহলে এটি ব্রেক বা সমস্যা ছাড়াই খুব দ্রুত কাজ করে! ইংরেজি অক্ষরের মতো...
এবং নিম্নলিখিত একটি জগাখিচুড়ি হয়!!! সত্য, এখন আমাদের এই utf-8 ব্যবহার করতে হবে। এমন কোন সিস্টেম নেই যেখানে সিস্টেম এনকোডিং ASCII হবে। তারা ইতিমধ্যে এটি করা বন্ধ করে দিয়েছে। এবং সমস্ত সিস্টেম ফাইল uft-8 এ রয়েছে। এবং যদি আপনি ASCII চান, তাহলে আপনাকে সব সময় পুনরায় কোড করতে হবে। আগে এটা করার দরকার ছিল না। আমি আশা করি আমাদের এখনও তাদের স্ট্যান্ডার্ড ক্রাচ ছাড়াই তাদের নিজস্ব সিস্টেম তৈরি করবে...

তথ্য এনকোড করার অনেক উপায় রয়েছে, যার সময় বার্তাটি প্রতীকগুলির সংমিশ্রণে রূপান্তরিত হয়। এটি প্রায়শই ঘটে যে আপনি যখন একটি ওয়েব পৃষ্ঠাতে যান, তখন অক্ষরের পরিবর্তে অদ্ভুত চিহ্নগুলি উপস্থিত হয়।

আপনার প্রয়োজন হবে

  • - ইন্টারনেট অ্যাক্সেস সহ একটি কম্পিউটার।

নির্দেশনা

  • ফাইল এনকোডিং খুঁজে বের করতে এবং অক্ষরগুলি ডিকোড করতে একটি অনলাইন ডিকোডার ব্যবহার করুন। এটি করতে, ব্রাউজার প্রোগ্রামটি খুলুন, http://www.artlebedev.ru/tools/decoder/ লিঙ্কটি অনুসরণ করুন। এই ডিকোডারটি ব্যবহারকারীদের অস্পষ্ট ইমেল বার্তা পড়তে সাহায্য করার জন্য ইমেল বার্তাগুলি ডিকোড করার জন্য তৈরি করা হয়েছিল৷
  • পাঠ্যের এনকোডিং খুঁজে বের করতে, এটি ক্লিপবোর্ডে অনুলিপি করুন, তারপরে ডিকোডার ক্ষেত্রে ডান-ক্লিক করুন এবং "পেস্ট" কমান্ডটি নির্বাচন করুন। এরপর, "ডিক্রিপ্ট" বোতামে ক্লিক করুন। ডিকোড করা পাঠ্যটি ক্ষেত্রে প্রদর্শিত হবে, এবং নীচের পৃষ্ঠায় উত্স এনকোডিং এবং পাঠ্যটি পুনঃকোড করা হয়েছে এমন এনকোডিং নির্দেশিত হবে৷
  • এনকোডিং নির্ধারণ করতে একটি বিশেষ প্রোগ্রাম ডাউনলোড করুন, সেইসাথে পাঠ্য ট্রান্সকোড করতে, উদাহরণস্বরূপ, Tcode প্রোগ্রাম। এটি করতে, http://it.sander.su/download.php লিঙ্কটি অনুসরণ করুন, TCode লিঙ্কে ক্লিক করুন, ফাইলটি ডাউনলোড করার জন্য অপেক্ষা করুন। ডাউনলোড সম্পূর্ণ হওয়ার পরে, আর্কাইভটিকে যেকোনো ফোল্ডারে আনজিপ করুন এবং এক্সিকিউটেবল ফাইলটি চালান।
  • যে ফাইলটির জন্য আপনাকে এনকোডিং জানতে হবে সেটি থেকে পাঠ্য সন্নিবেশ করুন, অথবা টুলবারে "ফাইল খুলুন" বোতামটি নির্বাচন করুন৷ এরপর, "রিকোড" স্ক্রিনের নীচে বোতামে ক্লিক করুন। ফাইল থেকে পাঠ্য স্বয়ংক্রিয়ভাবে প্রয়োজনীয় এনকোডিং এ পুনরায় কোড করা হবে। মূল এনকোডিং স্ট্যাটাস বারে প্রদর্শিত হবে, এবং অক্ষর স্বীকৃতির শতাংশও প্রদর্শিত হবে। এই লাইনের উপর হোভার করে, আপনি নির্ধারণ করতে পারেন কোন অক্ষরগুলি প্রোগ্রাম দ্বারা স্বীকৃত হয়নি।
  • AkelPad ইনস্টল করুন, যা ফাইল এনকোডিং চিনতে পারে। এটি করার জন্য, http://akelpad.sourceforge.net/ru/download.php লিঙ্কটি অনুসরণ করুন এবং ডাউনলোড করতে পছন্দসই সংস্করণ নির্বাচন করুন। ইনস্টলেশনের পরে, প্রোগ্রামটি চালু করুন। এনকোডিং নির্ধারণ করতে ফাইল থেকে পাঠ্য আটকান।
  • "এনকোডিং" মেনু এবং "এনকোডিং সংজ্ঞায়িত করুন" কমান্ড নির্বাচন করুন, অথবা Alt+F5 কী সমন্বয় ব্যবহার করে এই কমান্ডটিকে কল করুন। একটি উইন্ডো প্রদর্শিত হবে যেখানে উত্স এনকোডিং নির্দেশিত হবে এবং পাঠ্য পড়ার জন্য প্রয়োজনীয় এনকোডিংয়ে পাঠ্যকে ট্রান্সকোড করার বিকল্পও অফার করবে।
  • টিপ জুলাই 27, 2011 এ যোগ করা হয়েছে টিপ 2: কীভাবে এনকোডিং নির্ধারণ করা যায় কখনও কখনও প্রয়োজনীয় ফাইল বা ওয়েব পৃষ্ঠাটি খোলে না এবং যখন এটি প্রদর্শিত হয়, শুধুমাত্র অবোধ্য অক্ষরগুলি দৃশ্যমান হয়৷ এমন সময় আছে যখন একটি টেক্সট এডিটর বা ব্রাউজার প্রয়োজনীয় এনকোডিং নির্ধারণ করতে পারে না। এই ক্ষেত্রে, আপনাকে অতিরিক্ত ইউটিলিটিগুলি ব্যবহার করে এটি নিজেই নির্বাচন করতে হবে।

    আপনার প্রয়োজন হবে

    • একটি পাঠ্য সম্পাদক যা প্রচুর সংখ্যক এনকোডিং বা একটি ডিকোডার প্রোগ্রামের সাথে কাজ করে।

    নির্দেশনা

  • যদি একটি ফাইল একটি সম্পাদকে ভুলভাবে খোলে, এর অর্থ এই নয় যে এটিতে ভুল এনকোডিং রয়েছে৷ অন্য প্রোগ্রামে একই ফাইল খোলার চেষ্টা করা মূল্যবান। একটি ইউটিলিটি যা, বেশিরভাগ ক্ষেত্রে, সঠিকভাবে প্রয়োজনীয় অক্ষর সেট নির্ধারণ করে তা হল বিনামূল্যের নোটপ্যাড++ সম্পাদক।
  • আপনি যদি এখনও ফাইলটি খুলতে না পারেন তবে আপনি এনকোডিং নির্ধারণ করতে অনলাইন পরিষেবাগুলি ব্যবহার করতে পারেন, যার মধ্যে ইন্টারনেটে অনেকগুলি রয়েছে৷
  • এছাড়াও বিভিন্ন এনকোডিংয়ে রাশিয়ান পাঠ্য পাঠোদ্ধার করতে পারে এমন প্রোগ্রাম রয়েছে। নিঃসন্দেহে, নেতা হল Windows এর জন্য Stirlitz অ্যাপ্লিকেশন। এটি প্রায় সমস্ত কোড শীট জানে এবং অনেক ট্রান্সলিটারেশন পদ্ধতি জানে। অধিকন্তু, এই প্রোগ্রামটি মূল বিন্যাস থেকে অন্য যেকোন টেক্সট ট্রান্সফরমেশন অপারেশন করতে সক্ষম।
  • লিনাক্সে, একটি অপরিচিত এনকোডিং সম্বলিত একটি ফাইল খুলতে, আপনি কিছু কনসোল রূপান্তর কমান্ড বা রেডিমেড প্রোগ্রাম ব্যবহার করতে পারেন। QT-এর অধীনে, QTexTransformer নামে একটি অ্যাপ্লিকেশন রয়েছে, যা আপনাকে এনকোডিংয়ের নাম নির্ধারণ করতে এবং উপযুক্ত রূপান্তর করতে সাহায্য করবে। লিনাক্সের অধীনে, পার্লে লেখা অনেক ভাষাগত মডিউল রয়েছে। উদাহরণস্বরূপ, Lingua DetectCharset বা DetectCyrillic (সিরিলিক অক্ষর সনাক্ত করতে)। মাউসপ্যাড প্রোগ্রাম উইন্ডোজ ফাইলগুলিকে ভালোভাবে প্রদর্শন করে। রূপান্তর করতে, আপনি কনসোল কমান্ড "econv path_to_file" ব্যবহার করতে পারেন, যা স্বাধীনভাবে বর্তমান এনকোডিং নির্ধারণ করবে এবং বর্তমান লোকেলে রূপান্তর করবে।
  • দরকারী পরামর্শ ওয়ার্ড প্রসেসর ওয়ার্ড সঠিক এনকোডিং বেছে নেওয়ার জন্য একটি ভাল কাজ করে। অন্য এডিটরগুলিতে ফাইলটি না খোলা থাকলেও "অটো সিলেক্ট" ফাংশন এতে কাজ করবে। সূত্র
    • সবচেয়ে বিখ্যাত টেক্সট ডিকোডার এক
    কীভাবে এনকোডিং নির্ধারণ করবেন - মুদ্রণযোগ্য সংস্করণ
    আপনি নিবন্ধটি পছন্দ করেছেন? বন্ধুদের সাথে ভাগাভাগি করা: