পূর্ণাঙ্গ বাংলা ওসিআর : পুঁথি

Putiদেশের প্রযুক্তি প্রতিষ্ঠান ‘টিম ইঞ্জিন’ প্রথমবারের মতো সফলভাবে বাংলা ওসিআর (অপটিক্যাল ক্যারেক্টর রিকগনাইজার) তৈরি করতে সম হয়েছে। টিম ইঞ্জিনের তৈরি এই ওসিআরের নাম পুঁথি। এই ওসিআরের একটি বড় বৈশিষ্ট্য হলো এর অ্যাকুরেসি রেট শতকরা ৯৫ ভাগ, যা অন্যান্য ভাষার ওসিআরের থেকেও অনেক এগিয়ে। একই সাথে এর আর একটি গুরুত্বপূর্ণ বৈশিষ্ট্য হচ্ছে, বিজয় কিবোর্ডে লেখা একটি ইমেজকে ওসিআর করলে ইমেজের কনটেন্ট সরাসরি ইউনিকোড ফরম্যাটে চলে আসবে। টিম ইঞ্জিনের ব্যবস্থাপনা পরিচালক সামিরা জুবেরি হিমিকা জানিয়েছেন বাংলা ওসিআরের আদ্যোপান্ত। লিখেছেন আহমেদ ইফতেখার।
শাহজালাল বিজ্ঞান ও প্রযুক্তি বিশ্ববিদ্যালয়ের অধ্যাপক ড. মুহম্মদ জাফর ইকবাল এই ওসিআরের স্বপ্নদ্রষ্টা। তারই পরামর্শে ২০১২ সালের ডিসেম্বরে বাংলা ওসিআর তৈরির কাজ শুরু করে ‘টিম ইঞ্জিন’। সফটওয়্যার আর্কিটেক্ট এস এম আল-আমিনের নেতৃত্বে ১৫ জনের একটি দল এ প্রকল্পে কাজ করছেন। গত ৭ আগষ্ট বেসরকারি প্রতিষ্ঠান ‘টিম ইঞ্জিন’ তাদের উদ্ভাবিত বাংলা ওসিআর ‘পুঁথি’-এর উদ্বোধন ঘোষনা করে। অনুষ্ঠানে প্রধান অতিথির বক্তব্যে অর্থমন্ত্রী আবুল মাল আবদুল মুহিত বাংলা ওসিআর তৈরির জন্য টিম ইঞ্জিনকে ধন্যবাদ জানান। তিনি বলেন, এতে করে আমাদের সরকারি নথিপত্র সংরক্ষণের ঝামেলা অনেকটা কমে যাবে। ডিজিটাল বাংলাদেশের অন্যতম কাজ হলো প্রথমেই আন্তঃমন্ত্রণালয়ের কার্যক্রমকে ডিজিটালাইজড করা। আর ডিজিটালাইজড করার অনেকে ধাপ রয়েছে। একটি গুরুত্বপূর্ণ ধাপ হলো ডকুমেন্টেশন প্রক্রিয়াকে ডিজিটালাইজড করা এবং পুরনো ডকুমেন্টগুলোকে খোঁজায় সহজলভ্য করা।
বিশ্বের ৩৭তম দেশ হিসেবে অপটিক্যাল ক্যারেক্টার রিডার (ওসিআর) তৈরি করেছে বাংলাদেশ, বাংলা ওসিআর উদ্বোধন করতে এসে এ কথা বলেন তথ্য ও প্রযুক্তি প্রতিমন্ত্রী জুনাইদ আহমেদ পলক। হিন্দি ভাষার ওসিআর এখনো হয়নি, ৩৭তম দেশ হিসেবে আমরা ওসিআর উদ্বোধন করতে যাচ্ছি।
বাংলাদেশ কম্পিউটার সমিতির (বিসিএস) সাবেক সভাপতি ও কম্পিউটারে বহুল ব্যবহৃত বাংলা লিখনপদ্ধতি বিজয়ের প্রবর্তক মোস্তাফা জব্বার বলেন, ‘কম্পিউটিংয়ে বাংলা ব্যবহারের ক্ষেত্রে আমরা যে চ্যালেঞ্জ সবচেয়ে বেশি মোকাবেলা করছিলাম তা হচ্ছে অপটিক্যাল ক্যারেক্টার রিডার পাওয়া, ওসিআর ‘পুঁথি’ বাংলাদেশের জন্য অবশ্যই অনেক বড় ঘটনা।’
টিম ইঞ্জিনের ব্যবস্থাপনা পরিচালক সমিরা জুবেরী হিমিকা বলেন, এই সফটওয়্যারের মাধ্যমে আগের সব ফাইল ডিজিটাল ফরম্যাটে হার্ডডিস্কে সংরণ করা যাবে। এ ছাড়া অনলাইন লাইব্রেরি প্রতিষ্ঠায় বাংলা ওসিআর একটি গুরুত্বপূর্ণ ভূমিকা রাখবে। বাংলা অপটিক্যাল ক্যারেক্টার রিকগনাইজার (ওসিআর) ‘পুঁথি’ ৪ সেকেন্ডে বইয়ের একটি পাতাকে ডিজিটাইজ এবং এডিটেবল করতে পারে এবং মূল টেক্সটের শতকরা ৯৫ ভাগের বেশি শব্দ নির্ভুলভাবে প্রদর্শন করতে সম। বাংলা ভাষায় লিখিত সব কনটেন্ট ডিজিটালের মাধ্যমে সংরক্ষণ করতে টিম ইঞ্জিনের তৈরি পুঁথি ওসিআর অগ্রণী ভূমিকা পালন করবে বলে জানিয়েছেন পুথির নির্মাতা কর্তৃপক্ষ। এতে সংরণ করা যাবে নতুন পুরনো বইয়ের সব ধরনের তথ্য। ন্যাশনাল লাইব্রেরি থেকে শুরু করে অন্য লাইব্রেরিকে অনলাইনে নিয়ে আসার একটি বড় মাধ্যম হিসেবে কাজ করবে ওসিআর। এ ছাড়া সরকারি-বেসরকারি অনেক প্রতিষ্ঠান যেমন সংবাদপত্র শুধু ডকুমেন্টের ইমেজ ফরম্যাটটি ওয়েবে আপ করে দেয়। গবেষণা বা অন্য প্রয়োজনে কোনো তথ্য সার্চ দিলে ওই ইমেজ ফরম্যাট থেকে তা খুঁজে পাওয়া যায় না। ওসিআর অপটিক্যালি ক্যারেক্টারকে রিড করে পাঠককে এই তথ্যের সন্ধান দেবে।
এনবিআর, আদালত, ব্যাংক, জমির নিবন্ধন অফিস এ রকম অনেক সরকারি ও বেসরকারি প্রতিষ্ঠান রয়েছে যাদের প্রাত্যহিক অফিসিয়াল কার্যক্রম সম্পাদন করতে অনেক পুরনো ডকুমেন্ট সার্চ করতে হয়। বিভিন্ন প্রতিষ্ঠানের কোনো বিষয়ে ডকুমেন্ট সার্চ করতে কোড নম্বর দিয়ে সার্চ করতে হয়। নাম দিয়ে সার্চ করা যায় না। ওসিআর ব্যবহার করে এই সুবিধাটি পাওয়া যায়। ওসিআরের মাধ্যমে ডকুমেন্টের ইমেজকে ওয়ার্ডে কনভার্ট করে অথবা সরাসরি ইমেজ থেকে রিড করে আউটপুট বের করা যাবে।
বাংলাদেশ সরকার ওসিআর তৈরির জন্য নেপালকে আট বছর ধরে অর্থায়ন করে যাচ্ছে; কিন্তু এখন পর্যন্ত নেপাল আশানুরূপ ভূমিকা রাখতে পারেনি। একই সাথে ভারত সরকারকেও সাত বছর ধরে বাংলাদেশ অর্থায়ন করলেও তারা কেবল তাদের হিন্দি ভাষাকে ইংরেজি ভাষায় অনুবাদ করতে সম হয়েছে; কিন্তু এখন সেই নেপাল, ভারত ও পাকিস্তানই আমাদের তৈরি ওসিআরের জন্য আমাদের প্রতিষ্ঠানের কাছে সহযোগিতা চাচ্ছে। সুতরাং এটা আমাদের একটি বিরাট সফলতা।
বর্তমানে সরকার যে ডিজিটালাইজেশনের কথা বলছে, এর সুফল জনসাধারণের দোরগোড়ায় পৌঁছে দিতে চাচ্ছে, তারই অংশ হিসেবে আমাদের এই ওসিআর বিনামূল্যে প্রতিটি থানা ও উপজেলার স্কুল, কলেজ এবং বিশ্ববিদ্যালয়গুলোর পাশাপাশি থানা সহায়তা কেন্দ্রে পৌঁছে দিক। এ ছাড়া যদি কোনো প্রতিষ্ঠান বা ব্যক্তি ব্যক্তিগতভাবে ব্যবহার করতে চান, তাহলে তিনি বিনামূল্যে ব্যবহার করতে পারবেন।
বাংলা ওসিআর বাজারে আসলে বাংলাদেশের দৃষ্টিপ্রতিবন্ধী যারা আছেন তাদের একটি বড় ধরনের উপকার হবে। তারা পাঠ্যবই হাতে পান অনেক দেরিতে। বাংলা ভাষায় ব্রেইল বই রয়েছে ৮-৯টি টাইটেলের। অডিও বুক আরো কম। ওসিআর ব্যবহার করে পুরনো বা নতুন বইকে ব্রেইল বইয়ে রূপান্তর খুব সহজেই করা সম্ভব। অডিও বুক করাও সহজতর হবে। বইটি স্ক্যান করেও করা যায় তবে টেক্সট এডিট করতে গেলে ওসিআর তাকে সাহায্য করবে।
ওসিআর ছাড়া আমাদের ইংরেজি ভাষায় টেক্সট টু স্পিচ রয়েছে। অন্যান্য ভাষায়ও রয়েছে। বাংলা ভাষায় প্রথম টেক্সট টু স্পিচ নিয়ে আসছে টিম ইঞ্জিন। ইংরেজি টেক্সট টু স্পিচ সফটওয়্যার দিয়েও এই কাজ করা যায়। তবে সে েেত্র বাংলা লেখাকে ইংরেজি অরে লিখতে হয়, যা অনেক জটিল প্রক্রিয়া; কিন্তু বাংলা টেক্সট টু স্পিচ সফটওয়্যার দিয়ে বাংলা লেখা থেকেই বাংলা পড়ে শোনাবে। টিম ইঞ্জিনের তৈরি করা টেক্সট টু স্পিচ সফটওয়্যারটির প্রথম পর্যায়টি শেষ হয়েছে। এটি এখন বাংলা টেক্সটকে ডিটেক্ট করতে পারে এবং পড়তে পারে।। কোথায় থামতে হবে সেটাও বুঝতে পারে। এখন সেখানে ইমোশন নিয়ে আসা হচ্ছে। বাংলা ভাষার টেক্সট টু স্পিচে মেশিন ভাষা নয়, হিউম্যান ভয়েস নিয়ে আসা হয়েছে। পুথি সম্পর্কে বিস্তারিত জানতে www.puthiocr.com সাইটে ভিজিট করতে পারেন।

আরও পড়ুন

Leave a Reply

Your email address will not be published. Required fields are marked *

আরও দেখুন...
Close
Back to top button