ট্রেন্ডিং নিউজ

কিভাবে IELTS-এ ভালো ফলাফল করবেন?

ইংরেজীতে “তাই না?” ব্যবহার করার কিছু সহজ টিপস!

খেয়ে আসুন আদিবাসীদের সুস্বাদু খাবার ”মুন্ডি”

তবে কি জাপানিজরা শীঘ্রই বিলুপ্তির পথে?

বিশ্বকাপ ফুটবল নিয়ে যে কুড়িটি চাঞ্চল্যকর তথ্য অনেকেই জানেন না!

শনিবার ২০ অক্টোবর, ২০১৮

ফেসবুক মেসেনজার বট ও ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং নিয়ে কিছু কথা

টেকনোলজির লেটেষ্ট খোজঁ খবর যারা রাখেন, তারা কি জানেন যে, শুধু বাংলাদেশে নয়, পুরো দক্ষিন এশিয়ার ভেতর সংবাদপত্রের জগতে সর্বপ্রথম ম্যাসেনজার বটস (Messenger Bots) ব্যবহার করা শুরু করেছে দ্য ডেইলি ষ্টারের ফেসবুক ফ্যান পেইজ। গত মাসে তারা এটা লঞ্চ করে। এই কথাটি আমি জানতে পেরেছি গত বছরের F8 Meetup Dhaka তে এটেন্ড করে। ডেইলি স্টারের মার্কেটিং হেড এর উপর প্রেজেনটেশান দিলেন।
 
তাদের বট ম্যাসেনজারের বৈশিষ্ট্য হলোঃ
 
১) আপনি ইনবক্সে নক করলে আপনাকে নাম ধরে সম্বোধন করবে।
২) আপনি কি ধরনের নিউজ চান সে ব্যাপারে আপনাকে গাইড করবে।
৩) কি কি সংবাদ আপনি প্রতিদিন আপনার ইনবক্সে পেতে চান, সেগুলো ঠিক করে দিতে পারবেন।
৪) বিভিন্ন শব্দ দিয়ে সার্চ করতে পারবেন, ইনবকসের ভেতরই।
 
এটি বানাতে লেগেছে প্রায় মাস তিনেক। খরচের ব্যাপারটা গোপন রাখা হয়েছে। এটিতে বাংলা ভাষার উপযোগী করে বানানোরও চেষ্টা চলছে এখন।
 
BOT কি?
বট হচ্ছে এক ধরনের কৃত্রিম বুদ্ধিমত্তার ‍খুব ছোট্ট একটি সংস্করণ, এটি ফেসবুক চালু করেছে মূলত ব্যবসায়ীক ও মার্কেটিং প্রয়োজন পূরণ করতে, যাতে করে স্বয়ংক্রিয় পদ্ধতিতে আপনি আপনার পেইজ থেকে আপনার কাষ্টমারকে যথাযথ তথ্য দিয়ে তাকে সর্বোচ্চ সাহায্য করতে পারেন। 
 
ওয়ালষ্ট্রিট জার্নাল, বার্গার কিং, স্প্রিংসহ আরো অনেক বিখ্যাত কোম্পানিই তাদের ফেইসবুক পেইজে গত দেড় বছর থেকে নিয়মিতভাবে ম্যাসেনজার বট ইউজ করে, কিন্তু এশিয়াতে সংবাদপত্রের জগতে এই প্রথম কোন পেইজ এটা ব্যবহার করা শুরু করা হলো।
 
ডেইলি স্টারের ফেসবুক পেইজের বট

ডেইলি স্টারের ফেসবুক পেইজের বট

গতকাল মিট আপের শেষে চারজনের একটা প্যানেল ডিসকাসশনের কিছু চুম্বক পয়েন্ট তুলে ধরলাম। ডিসকাসনে ছিলেনঃ অনুষ্ঠান সঞ্চালক ও হোয়াইট
বোর্ডের একজন কর্মকর্তা, ঢাকা সফটের সিইও, আশরাফুল আমিন (AIUB’র রোবটিক্স ম্যাকানিজম বিভাগের প্রফেসর), তানভীর সৌরভ (Socian এর সিইও ও উদ্যোক্তা) এবং ডেইলি স্টারের তৎলীন মার্কেটিং বিভাগের হেড। 
 
তাঁরা কিছু গুরুত্বপূর্ণ বিষয় নিয়ে আলোচনা করেছেন, সেগুলো মুটামুটি আমরা এই প্রবন্ধে সংক্ষেপে তুলে ধরার চেষ্টা করেছি।
(একটা ব্যাপার শুরুতেই বলে রাখি, আমি কম্পিউটার প্রোগ্রামার নই, এমনকি কোন টেকনিক্যাল লাইনের মানুষও নই। স্রেফ কম্পিউটার প্রযুক্তি এবং বিজ্ঞানের প্রতি অগাধ ভালোবাসার কারনে আমার নিজের মনের ক্ষুধা মেটানোর জন্য এইসব নিয়ে পড়াশোনা করতে ও খোজঁ খবর রাখতে ভালোবাসি। এবং কৃত্রিম বুদ্ধিমত্তা নিয়ে টুকটাক পড়াশোনা করতে ছোটবেলা থেকেই অনেক ভালো লাগতো। সেটা করতে গিয়েই প্রোগ্রামিং, বট, নড, নিউরাল নেটওয়ার্ক, মেশিন লার্নিং, ডেটা এনালাইসিস, ডেটা সায়েন্স, ডেটা মাইনিং ইত্যাদি কঠিন কঠিন শব্দ ও তার সংক্ষিপ্ত সংজ্ঞা আমাকে শিখতে হয়েছে।)
 
– ফেসবুকের বিভিন্ন পেইজ থেকে গত ৫ বছরে প্রায় ২০ ট্যারাবাইট ডেটা তারা (Socian) ফেসবুকের গ্রাফ এপিআই দিয়ে পুল করেছে নিজেদের সার্ভারে। এই সব ডেটার সবগুলোই ফেববুক ইউজার জেনারেটেড। আপনার AI বা বট ততবেশী স্মার্ট হবে, যত বেশী ডেটা আপনি তাকে ইনপুট দিবেন, যত বেশী মডেল তাকে শেখাবেন। এই ডেটাগুলো খাওয়ালে AI এর Node ভীষন শক্তিশালি হবে, কোন সন্দেহ নাই। কিন্তু এই ডেটাগুলো আন ট্যাগড। এক পর্যায়ে আশরাফুল আমিন স্যার তানভীর সৌরভের কাছে জানতে চাইলেনঃ

  গত বছর ঢাকাস্থ জিপি হাউসে ফেসবুক মিটাপের একটি দৃশ্য!

– এগুলো কি ট্যাগ করা?

– না ট্যাগ করা হয়নি এখনো।

– ২০ টেরাবাইট ডেটা ট্যাগ করতে তো প্রায় ৩০ বছর লেগে যাবে।
 
প্রশ্নত্তর পর্বে আমি তাদের কাছে জানতে চাইলাম – ”২০ টেরাবাইট ডেটা ট্যাগ করার জন্য হিউজ সময় আর টাকা দরকার, তার চে বরং আপনারা এটাকে ওপেনসোর্স করে দিচ্ছেন না কেন?” জবাবে তানভীর নালেন – তাদের ইচ্ছে আছে, খুব শীঘ্রই তাদের প্রজেক্টকে ওপেন সোর্স করে দিবেন।
এরপর কথা হলো NLP বা ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং নিয়ে। মানে হচ্ছে, আপনি আমি আমাদের আটপৌঢ়ে ভাষায় যেভাবে কথা বলি/লিখি, সেভাবেই কম্পিউটারকে বল্লে সে বুঝতে পারবে। মানে আমরা তো সব সময় বলি না যে – “তুমি কি ভাত খেয়েছো?” আমরা বেশীরভাগ সময় বলি – ”তুমি কি ভাত খাইসো”?
 
স্ট্যান্ডার্ড ইনপুটে শুধূু “খেয়েছো” বল্লে বট বুঝবে, কিন্তু ”খাইসো” বল্লে আর বুঝবে না। NLP এর কাজ হচ্ছে, আপনি ওকে যেভাবেই বলেন না কেন, ও বুঝতে পারবে আপনি ওকে কি বলতে চাইছেন। আঞ্চলিক ভাষা, এমনকি মুরাদ টাকলা ভাষাও যেন বোঝে, সেইটার ব্যবস্থাও নাকি রাখা হবে! 😛
মানে আপনি ওকেঃ
 
১) তুমি কি ভাত খেয়েছো?
২) তুমি কি ভাত খাইসো?
৩) tmi ki bat kaico?
৪) তুই কি ভাত খাইছুইন? (আঞ্চলিক ভাষা)
 
এই চারটার যে কোনটাই আপনি বলেন না কেন, NLP এর কাজ হলো একটা স্মার্ট ম্যাসেনজার বটকে বুঝানো যে আপনি তার কাছে জানতে চাইছেন যে সে ভাত খেয়েছে কিনা। 😀
আমি চিন্তা করছি, চিটাগাং, নোয়াখালি, বরিশাল আর সিলেটের ভাষা দিয়ে NLP করার সময় প্রোগ্রামারদের কালঘাম ছুটে যাবে, এবং এইটা একটা দারুন ব্যাপার হবে। যার যার জেলার ভাষা প্রসেস করার সময় উক্ত জেলার প্রোগ্রামারদের নিয়োগ দিলেই মনে হয় কাজ অনেকটা সহজ হয়ে যাবে। মানুষ আঞ্চলিক ভাষায় চ্যাট করে না বল্লেই চলে, তাই এর প্রয়োজনীয়তা হয়তো নেই, কিন্তু এর মাধ্যমে আমাদের দেশের সবগুলো জেলার সবগুলো ভাষার একটা ডিজিটাল আর্কাইভ থাকবে, একটা মডেল/প্যাটার্ন থাকবে, যেটা নিয়ে ভাষা বিজ্ঞানীরা গবেষণাও করতে পারবেন।
 
আমাদের দেশে ১৬ কোটি মানুষ, এই দেশের মানুষ হিউজ পরিমান ন্যাচারাল ল্যাংগুয়েজ জেনারেট করেছে, এবং করছে। অথচ আমাদের চাইতে অনেক কম মানুষ আর কম NL আছে ফ্রান্সে, জার্মানীতে। অথচ তাদের NLP অনেক অনেক বেশী শক্তিশালী, স্মার্ট আর কার্যকরী আমাদের চেয়ে।
 
এরপর কথা হলো, কম্পিউটার সায়েন্স পড়ার সময় ইউনিতে ডিফারেনসিয়াল ক্যালকুলাস, বুলিয়ান এলজ্রেবা, স্ট্যাটাসটিকস – এইসব কেন পড়ানো হতো? কম্পিউটারের সাথে এইসবের সম্পর্ক কি, এইসব পড়ার সময় অনেকেই প্রশ্ন করে থাকেন। এর উত্তরও তিনি দিলেন।
প্রচুর পরিমান raw data নিয়ে কাজ করার সময় যে মডেলিং দাড় করানো হয়, সেটার মধ্যে থেকে আপনি যদি শুধুমাত্র বাংলা ভাষাকে আলাদা করতে চান, মানে আপনি চান যে আপনার বট বাংলা ভাষাকে ডিটেক্ট করতে পারবে, তাহলে আপনার এই তিনটা বিষয়ের উপরই সমান দক্ষতা থাকতে হবে।
 
AI মডেলিং ইউজ করে বিভিন্ন ছবি, ভিডিও বা গ্রাফিক্সের যে এনালাইসিস করা হয়, সেটার একুরেন্সি প্রায় ৯৬%। এটা এখন পর্যন্ত মানব আবিস্কৃত যত পদ্ধতি আছে এনালাইসিস করার, তার ভেতর সবচাইতে বেশী। এবং এই কার্যক্ষমতা দ্রুত বাড়ছে।
লেখাটি নেয়া হয়েছে প্রলয় হাসানের ফেসবুক পেইজ হতে। ছবিসূত্রঃ গুগল।  ঢাকা মিট আপের দৃশ্য ও ডেইলি স্টারের বটের স্ক্রিনশট সূত্রঃ প্রলয় হাসান।

Comments

মন্তব্য করুন

এই বিভাগের অন্যান্য পোস্ট