https://www.bigganchinta.com/technology/eelcettldu
প্রকাশ: ২০ আগস্ট ২০২৫, ২১: ২৮
প্রতিদিন এআই দিয়ে ছবি তৈরি করছি আমরা, বানাচ্ছি ফেসবুক পোস্ট, লিখিয়ে নিচ্ছি নানা ধরনের কনটেন্ট। কৃত্রিম বুদ্ধিমত্তা বা এআই কীভাবে এসব কনটেন্ট তৈরি করে? এর পেছনের প্রযুক্তি, ইতিহাস এবং ভবিষ্যতের নানা দিক উঠে এসেছে এই ধারাবাহিক লেখায়।
আপনারা অনেকেই হয়তো ইতিমধ্যেই কৃত্রিম বুদ্ধিমত্তা বা এআই ব্যবহার করে কবিতা লিখেছেন, কিংবা ছবি আঁকিয়ে নিয়েছেন। এআই প্রযুক্তির শুরুর দিকে বিভিন্ন তথ্যভাণ্ডার ও অ্যালগরিদম ব্যবহার করে ছবি শনাক্ত করা সম্ভব হলেও এআই দিয়ে একেবারে নতুন কিছু তৈরি বা জেনারেট করা ছিল একরকম অসম্ভব। কিন্তু এখন এআই দিয়ে সহজেই এসব কাজ করা যাচ্ছে। এ নিয়েই আজকের আলোচনা। এ আলোচনায় আমরা জানব, কৃত্রিম বুদ্ধিমত্তা কীভাবে ছবি আঁকতে, ভিডিও কিংবা কনটেন্ট তৈরি করতে পারে। অর্থাৎ জেনারেটিভ বা সৃজনশীল কৃত্রিম বুদ্ধিমত্তার জন্ম হলো কীভাবে?
মনে করুন, একজন শিল্পী আছেন, যিনি খুব সুন্দর করে বিশ্ববিখ্যাত চিত্রশিল্পীদের আঁকা ছবির হুবহু নকল তৈরি করতে পারেন। তিনি লিওনার্দো দ্য ভিঞ্চির সেই বিখ্যাত মোনালিসা ছবিটি নকল করে আঁকলেন। এরপর সেই ছবি পরীক্ষা করতে এলেন একজন দক্ষ শিল্প-সমালোচক, যিনি নকল ছবি ধরতে ওস্তাদ। তিনি পরীক্ষা করে নকল ছবিটার খুঁত বা ভুলগুলো বের করে দিলেন। এরপর সেই নকল শিল্পী আবারও নতুন করে ছবি আঁকলেন এবং এবারে সেই ভুলগুলোকে শুধরে নিলেন। কিন্তু আবার যখন পরীক্ষা করা হলো, দেখা গেল, আবারও কিছু নতুন ভুল পাওয়া গেছে। এভাবে প্রতিবারের ভুল থেকে সেই শিল্পী আরও ভালোভাবে শিখে আরও ভালো নকল ছবি আঁকেন। সমালোচক আবার ভুল ধরে দেন, শিল্পী তখন আরও ভালো নকল আঁকেন। একসময় দেখা গেল, এই নকল প্রায় নির্ভুল, আসলের প্রায় কাছাকাছি। দিনে দিনে নকলকারী এত নিখুঁত ছবি আঁকতে শুরু করলেন যে একদিন সমালোচক সত্যিই বিভ্রান্ত হয়ে পড়লেন। তিনি আর বুঝতেই পারছেন না ছবিটি আসল না নকল!
<aside> 💡
একসময় দেখা গেল, এই নকল প্রায় নির্ভুল, আসলের প্রায় কাছাকাছি। দিনে দিনে নকলকারী এত নিখুঁত ছবি আঁকতে শুরু করলেন যে একদিন সমালোচক সত্যিই বিভ্রান্ত হয়ে পড়লেন। তিনি আর বুঝতেই পারছেন না ছবিটি আসল না নকল!
</aside>
এরকম দুজন ব্যক্তি যদি সত্যিকারের মানুষ না হয়ে দুটিই কৃত্রিম বুদ্ধিমত্তা হয়, তবে এই প্রক্রিয়ার মাধ্যমে কৃত্রিম বুদ্ধিমত্তা আরও সুন্দর ও নিখুঁত কিছু তৈরি করতে পারবে। সেটি হতে পারে ছবি, কবিতা কিংবা প্রবন্ধ। ওপরের এ উদাহরণে ‘জালিয়াত শিল্পী’ আসলে এরকমই একটি কম্পিউটার প্রোগ্রাম, আর ‘সমালোচক’ আরেকটি প্রোগ্রাম। তাদের এই প্রতিযোগিতামূলক শেখার পদ্ধতির ধারণাটিই বাস্তবে কৃত্রিম বুদ্ধিমত্তার জগতে এক বিপ্লব ঘটিয়েছিল।
২০১৪ সালে একটি যুগান্তকারী পদ্ধতি প্রস্তাব করা হয়। এর নাম জেনারেটিভ অ্যাডভার্সারিয়াল নেটওয়ার্ক**,** সংক্ষেপে গ্যান (GAN)। এই পদ্ধতিতে, ঠিক ওই গল্পের মতোই, দুটি এআই মডেল পরস্পরের সঙ্গে প্রতিযোগিতা করে নতুন কনটেন্ট বা তথ্য তৈরি করতে শেখে। এবারের লেখায় থাকছে সেই জেনারেটিভ মডেল কী, তাদের জন্মকাহিনি এবং কীভাবে তারা প্রযুক্তির জগতে সৃজনশীলতার দুয়ার খুলে দিল, সেই গল্প।
সহজ ভাষায় বললে, জেনারেটিভ মডেল হলো এমন একধরনের কৃত্রিম বুদ্ধিমত্তা মডেল, যা নতুন ডেটা বা কনটেন্ট তৈরি করতে পারে। কনটেন্ট বলতে টেক্সট (যেমন কবিতা, প্রবন্ধ কিংবা চিঠি), ছবি কিংবা ভিডিও—সবকিছুই এর আওতায় পড়ে। চলুন, আরেকটি উদাহরণ দেওয়া যাক। একটি জেনারেটিভ মডেল যদি অসংখ্য প্রাণীর ছবি দেখে শেখে, সে তখন এমন নতুন প্রাণীর ছবি বানিয়ে ফেলতে পারে, যেটি বাস্তবে কোনো ক্যামেরায় তোলা হয়নি; কিন্তু ছবিটি দেখলে সত্যিকারের জীবজন্তুর ছবির মতোই লাগে। অর্থাৎ মডেলটি নিজে নতুন উদাহরণ ‘উৎপাদন’ বা জেনারেট করছে।
অন্যদিকে ডিসক্রিমিনেটিভ মডেল নামে আরেক ধরনের মডেল আছে। এই মডেল কী করে? ধরুন, সেটি অনেক প্রাণীর ছবি দেখে শিখল। এখন তার কাজ হলো নতুন কোনো ছবি দেখলে বলতে পারা, এটা বিড়াল নাকি কুকুরের ছবি। সে নিজে নতুন ছবি বানায় না, শুধু কোনটি কোন প্রাণী, তা শনাক্ত করতে শেখে। সহজ করে বললে, জেনারেটিভ মডেল নতুন কিছু বানায়, আর ডিসক্রিমিনেটিভ মডেল যেকোনো কিছুকে আলাদা করে চিনতে শেখে।
<aside> 💡
একটি জেনারেটিভ মডেল যদি অসংখ্য প্রাণীর ছবি দেখে শেখে, সে তখন এমন নতুন প্রাণীর ছবি বানিয়ে ফেলতে পারে, যেটি বাস্তবে কোনো ক্যামেরায় তোলা হয়নি; কিন্তু ছবিটি দেখলে সত্যিকারের জীবজন্তুর ছবির মতোই লাগে। অর্থাৎ মডেলটি নিজে নতুন উদাহরণ ‘উৎপাদন’ বা জেনারেট করছে
</aside>
সমস্যা হলো, নতুন কিছু বানানো এত সহজ নয়। জেনারেটিভ মডেলকে তাই প্রচুর সূক্ষ্ম বিষয় শিখতে হয়, যা ডিসক্রিমিনেটিভ মডেলকে অনেক সময় শিখতে হয় না। ধরুন, আপনি এমন একটি এআই বানালেন। এটি ছবিতে নৌকা আছে কি না, তা চিনবে। সেটি হয়তো শুধু নৌকার কিছু নির্দিষ্ট আকৃতি বা বৈশিষ্ট্য (যেমন পানির ওপরে ভেসে থাকা একটি কাঠামো, পাল ইত্যাদি) দেখে শিখে নেবে এবং খুব জটিল কিছু না শিখলেও চলবে। কিন্তু আপনি যদি কৃত্রিম বুদ্ধিমত্তাকে বলেন, ‘তুমি নতুন একটা নৌকাসহ নদীর ছবি আঁকো’, তাহলে তাকে অনেক কিছু জানতে হবে। যেমন পানি কেমন হয়, নৌকা সাধারণত পানির ওপরেই থাকে, আকাশের সঙ্গে পানির রঙের সম্পর্ক, আলো-ছায়ার ব্যবহার, ইত্যাদি অসংখ্য সংশ্লিষ্ট ব্যাপার।