বিগ ডাটা কি এবং কেন! ( What is Big Data and Why? )

208
একটা সময় ছিলো যখন আমরা আমাদের সবকিছুই কাগজে লিখে রাখতাম। কখন খেতে যাবো, কবে মিটিং, কখন শপিং এ যাবো এসব টু ডু লিস্টগুলো কাগজে কিংবা ডায়েরীতে লিখে রাখতাম। এমনকি স্যারের কাছে পড়ার লেকচার থেকে শুরু করে দুধওয়ালা কিংবা পত্রিকার হকারের পেপার দেয়ার হিসেব ও!
প্রযুক্তির অভাবনীয় উন্নয়ন আমাদের জীবন করেছে সহজ এবং স্বাচ্ছন্দ্যময়। তথ্য-আদান প্রদানের পরিধি দিনের পর দিন বৃদ্ধি পাচ্ছে। সারাক্ষণ একে অন্যের কাছে বিভিন্ন তথ্য দিচ্ছি বা অন্যের কাছ থেকে তথ্য নিচ্ছি। যেদিন থেকেই ইন্টারনেট নামক ধারনাটি আমাদের মধ্যে বিকশিত হলো, সেদিন থেকেই এই তথ্য আদান-প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে। আচ্ছা আমরা যদি জানার চেষ্টা করি মানবজাতির সকল সংগ্রহীত ডাটার পরিমাণ কেমন! হুবহু বলতে না পারলেও আন্দাজ করা যায় ২০০৩ সাল পর্যন্ত আমাদের জমাকৃত ডাটার পরিমাণ প্রায় ৫ বিলিয়ন গিগাবাইট। বর্তমানে ইন্টারনেট এবং বিভিন্ন সোশ্যাল মিডিয়ার বদৌলতে প্রতিদিন ডাটার পরিমাণ কয়েকগুণ করে বৃদ্ধি পাচ্ছে।
নিচের ভিডিওটিতে বিষয়টি সম্পর্কে পরিষ্কার ধারনা পাওয়া যাবে,
 
চলুন একটু পেছনে ফিরে যাই এবং দেখে নেই, টেকনোলজি ওয়ার্ল্ড কিভাবে গত শতক থেকে রাতারাতি  চেঞ্জ হয়ে হয়ে গেছে :
১. বর্তমান  বিশ্বের শতকরা ৮০ ভাগ ইনফরমেশন এখন আনস্ট্রাকচার্ড(Unstructured).
২. আনস্ট্রাকচার্ড ডাটা স্ট্রাকচার্ড(Structured) ডাটা থেকে প্রায় ১৫ গুণ হারে বাড়ছে।
৩. ইনফরমেশনগুলো এক্সেস পাওয়া যেন সবারগণতান্ত্রিক অধিকার হয়ে দাঁড়িয়েছে , মানে সবার জন্য ইনফরমেশন গুলো এভেইল্যাবল।
৪. ২০২০ সালের মধ্যে ডাটা ক্রিয়েটিং রেট হবে ৪৪ট্রিলিয়ন গিগাবাইটস। [ফোর্বস ]
আর এই বিভিন্ন ওয়েবে, সেন্সরের মাধ্যমে, পরিবেশগত এবং আমাদের দ্বারা সৃষ্ট সব ডাটার সমষ্টিকে বলা হয় বিগ ডাটা।  এই ডাটার পরিমাণ এত বেশি যে সেগুলোকে গুটিকয়েক সাধারণ কম্পিউটার দ্বারা বিশ্লেষণ করা অসম্ভব (আংশিকভাবে সম্ভব হলেও তা বেশ কষ্টসাধ্য)। এসব বিষয় নিয়ে কাজ করে থাকেন ডাটা সায়েন্টিষ্টরা, নানান রিসার্চার, যারা এসব ডাটাকে অ্যানালাইসিস করেন।
ছবি- বিগডাটা কত বড়? [Bdnews24.com]
এখন প্রশ্ন হচ্ছে তাহলে বিগডাটা ব্যাপারটা আসলে ঠিক  কি!
নাম থেকেই বোঝা যাচ্ছে যে, এখানে বিশাল পরিমাণ তথ্য নিয়ে কাজ-কারবার। সেই বিশালতা কেমন? এটা এমনই বিশাল যে, গতানুগতিক ডাটাবেজের পক্ষে একে ধারণ করা সম্ভব হয় না, তাছাড়া এসব ডাটা এত দ্রুত ও বেশি পরিমানে তৈরি হচ্ছে যে আগেরকার ডাটা এনালাইসিসের উপায়গুলো দিয়ে এসব ডাটা এনালাইসিস করা সম্ভব হয় না। দরকার হচ্ছে নতুন প্রযুক্তি, নতুন চিন্তা। সব মিলিয়ে, যদি এমন কোন ডাটা আমরা দেখি যেটা সাধারণ পদ্ধতিতে আমাদের পক্ষে কোথাও স্টোর বা ধারণ করে রাখা, ওই ডাটা প্রসেস করা এবং ওই ডাটা থেকে প্রয়োজনিয় তথ্য বের করা সম্ভব না হয় তাহলেই সেই ডাটা বিগ ডাটা।
Oracle এর মতে,
"Big data describes a holistic information management strategy that includes and integrates many new types of data and data management alongside traditional data".
মুর্দা কথা হচ্ছে বর্তমান টেক ওয়ার্ল্ডে বিগ ডাটা এক ধরণের বাজওয়ার্ড। বিগডাটা শব্দটা বেশীরভাগ সময় আনস্ট্রাকচার্ড ডেটার ক্ষেত্রে ব্যবহার হয়। তবে স্ট্রাকচার্ড ডাটার ক্ষেত্রেও বিগডাটার ব্যবহার পরিলক্ষিত হয়। ( যেমন Data generate by FB and twitter)
অর্থ্যাৎ, ডেটা এমনভাবে আছে যে সরাসরি ব্যবহার করার উপায় নাই। তখন বিভিন্ন এলগরিদম ব্যবহার করে সেই ডেটা থেকে নানা তথ্য উপাত্ত বের করা হয়। অ্যালগরিদমগুলো বেশির ভাগ সময় মেশিন লার্নিং আর ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এ ব্যবহার করা হয়। কিন্তু এগুলো ছাড়াও শুধু পরিসংখ্যান, লিনিয়ার এলজেবরা, কিংবা স্ট্রিং প্রসেসিং করেও অনেক তথ্য উপাত্ত বের করে ফেলা যায়। উল্লেখ্য মেশিন লার্নিং প্রায় সব ডেটা সায়েন্সের ক্ষেত্রেই ব্যবহার করা হয়।
 নিচের ভিডিওটিতে বিগডাটা কি  এবং এর কাজ করার প্রক্রিয়া দেখানো হয়েছেঃ
 প্রত্যেক টার্মিনোলজির কতগুলো বৈশিষ্ট্য থাকে। বিগ ডাটারও বেশ কয়েকটি বৈশিষ্ট্য রয়েছে। মোটামুটি ভাবে বিগডাটার বেসিক তিনটি বৈশিষ্ট্য সম্পর্কে আলোকপাত করা হয়। যাকে 3Vs বলে আখ্যায়িত করা হয়।
  1. Volume
  2. Variety
  3. Velocity
১) ভলিউম : বিগডাটার ক্ষেত্রে, আমরা ভলিউম বলতে বুঝি হিউজ পরিমাণ ডাটা। যা সাধারণত পরিমাপ করা হয়ে থাকে Zettabytes(ZB) , Yottabytes (YB), Exabyte ইত্যাদি এককে। অর্থাৎ ভলিউম মানে উৎপন্ন এবং সংরক্ষিত ডেটার পরিমাণ । তবে কোন ডেটা বিগ ডেটা হিসেবে বিবেচনা করা যাবে কি যাবে না তা নির্ধারণ করে ডাটা সাইজ এবং ডাটা ধারণ ক্ষমতার উপর। বুঝার সুবিধার্থে এককের চার্টটা নিচে দেয়া হলো,
ছবি- উইকিপিডিয়া
 ২) Velocity (rapid procreation) :  যে গতিতে তথ্য তৈরি , তথ্য প্রক্রিয়াকরণ , তথ্য উন্নয়নের অগ্রগতি,  চাহিদা ও চ্যালেঞ্জগুলি সম্পন্ন করা হয় তাকে Velocity বলা হয়। বিগ ডাটা সাধারণত গতিময় বা টানা সৃষ্টি হতে থাকে। সাধারণত কোম্পানিগুলো ডাটা অ্যানালাইসিস করে থাকে batch প্রসেসসিং  প্রক্রিয়ায়। যা কিনা খুব ধীর গতিময়।  কিন্তু  বিগ ডাটা ফ্লো টা হচ্ছে কন্টিনিয়াস। ফলে কোম্পানিগুলোকে রিয়েল টাইম ডাটা এনালাইসিস এখন করে তাদের বিসনেস ডিসিশন নিতে হচ্ছে।
৩)  Variety: বিগ ডাটা প্রসেসিংয়ে যে চ্যালেঞ্জগুলোর সম্মুখীন হতে হয় তার মধ্যে তথ্য টাইপ এবং তথ্যের প্রকৃতি অন্যতম। কারণ ডাটা গুলো বিভিন্ন ধরণের হয়ে থাকে।  সেমি-স্ট্রাকচার ,আন-স্ট্রাকচার ,অডিও, ভিডিও , টেক্সট, লগ, ওয়েব ডাটা , XML, JSON  ইত্যাদি ধরণের ডাটা নিয়েই বিগ ডাটা। ডেটা সব ধরনের ফরম্যাটে সৃষ্টি হতে পারে। তবে  প্রথাগত ডেটাবেসগুলিতে সুরক্ষিত, সংখ্যাসূচক ডেটা থেকে অনুমোদিত পাঠ্য নথি, ইমেল, ভিডিও, অডিও, স্টক টিকার ডেটা এবং আর্থিক লেনদেনগুলিতে আসে। আর এই ডাটাগুলো অর্গানাইজ করা কিছুটা জটিল একটা প্রসেস। কারণ ডাটাগুলো রেপিডলি পরিবর্তন হয়।
এছাড়া ও বিগডাটা নিয়ে গবেষণা করলে বিগডাটার নিম্নোক্ত বৈশিষ্ট্য লক্ষ্য করা যায় :
৪) Variability: এটি ডাটা সেটের অসঙ্গতি  এবং ডাটা সেট পরিচালনা করার প্রক্রিয়াকে ব্যাহত করতে পারে।  Variability কিন্তু  Variety কনসেপ্ট থেকে সম্পূর্ণই আলাদা। এক্ষেত্রে একটা উদাহরণ দেয়া যেতে পারে, ধরুণ একটি রেস্টুরেন্ট অনেক ধরণের খাবার তৈরি করে। তো আপনি ডেইলি একই ধরণের খাবার খেলেও এক এক দিন এক এক রকমের টেস্ট পাচ্ছেন, এটাই  Variability।  যে সব ডাটা প্রতিনিয়ত বদলায় তাদের কে সংজ্ঞায়িত করতে Variability  টার্মটি ব্যবহার করা হয়।
৫) Veracity: প্রাপ্ত তথ্য ডেটার গুণগতমান ব্যাপকভাবে পরিবর্তিত হতে পারে যা সঠিক বিশ্লেষণকে প্রভাবিত করে। এক্ষেত্রে Veracity আমাদেরকে বিগ ডাটা থেকে প্রাপ্ত ডাটাগুলো কতটুকু নিখুঁত তা নিশ্চিত করে।
৬) Viscocity : Viscosity বা সান্দ্রতা কোন ঘটনা কিংবা ঘটনা সম্পর্কিত উপাত্ত বর্ণনা করতে ডাটা ভলিউমের মধ্যে প্রবাহ প্রতিরোধের পরিমাণ নির্দেশ করে। উদাহরণস্বরূপ ডেটা উৎস বিভিন্ন কারণে, তথ্য প্রবাহ বেগ এবং প্রক্রিয়াজাতকরণের  সময় বিভিন্ন জটিলতার সম্মুখীন হয়ে থাকে। মূলত এটি Velocity কে আর ও সহজভাবে ব্যাখ্যা করার জন্য ব্যবহার করা হয়।
৭) Value : ভ্যালুকে আমরা গেমের শেষ অংশ হিসাবে ধরতে পারি। বিগ ডাটার সব চেয়ে ইম্পরট্যান্ট পার্ট হচ্ছে ভ্যালু। উপরের সবগুলোই আছে কিন্তু ভ্যালু নাই , তাহলে সবাই অনর্থক।  কারণ বিজনেস  লিডাররা ভ্যালু থেকেই ডিসিশন নিয়ে থাকে।
ছবি- M-Brain
মোটামুটিভাবে উপরোক্ত আটটি বৈশিষ্ট্যের মাধ্যমে বিগডাটা আচরণ ব্যাখ্যা করা যায়।
তাই সংক্ষেপে বলতে গেলে বিগ ডাটা হচ্ছে High Volume, High Velocity এবং High Veriety ইনফরমেশনের এমন এক ভান্ডার। 
বিগ  ডেটা কেন গুরুত্বপূর্ণ?
সহজ করে বলতে গেলে বিগডাটা:
  • আপনার খরচ হ্রাস করবে
  • সময়ের সঠিক ব্যবহারে সহায়তা করবে তথা সময় ব্যয় হ্রাস করবে
  • নতুন ও উত্তম পণ্য উন্নয়ন বা নির্বানে সহায়তা করবে
  • স্মার্ট সিদ্ধান্ত গ্রহণ  করতে সাহায্য করবে
  • এছাড়াও শিক্ষা, স্বাস্থ্য, সরকার পরিচালনা, নগর পরিচালনা সব ক্ষেত্রেই গুরুত্বপূর্ণ ভূমিকা রাখতে পারবে।
উপরোক্ত বিষয়গুলো কয়েকটা দৃশ্যপটের  মাধ্যমে বুঝিয়ে দেয়া যেতে পারে: 
দৃশ্যপট - ১: ধরুন আপনার বান্ধবীর জন্মদিনে আপনি তাকে একটা ড্রেস গিফট করতে চান। কিন্তু হ্যায়, আপনিতো তার গায়ের মাপ জানেন না! কোন সমস্যা নেই। আপনার এই সমস্যা বিগ ডাটা সলভ করতে পারবে। শুধুমাত্র আপনার বান্ধবীর ছবি দিবেন। তারপর কম্পিউটার তার জামার সাইজ ঠিকঠাক বুজে নিতে পারবে এবং গিফটের দেয়ার পর আপনি বান্ধবীর ঝাড়ি থেকে বেঁচে যাবেন। 🙂
দৃশ্যপট - ২: আচ্ছা আমরা আবার উপরোক্ত কেস স্টাডিতে চলে যাই। আপনি একটু রসিক টাইপের। ভাবলেন বান্ধবীর জন্মদিন ম্যাচিং জামা পড়ে ক্যান্ডেল লাইট ডিনারে যাবেন। কিন্তু ভাবলেন,ইশ, আমাকে মানাবে তো! কোন সমস্যা নেই। কম্পিউটার আপনার পছন্দের এবং মানানসই জামা রিকোমেন্ড করতে পারে এবং কম্পিটারে আপনার পছন্দের ড্রেসটাতে ক্লিক করবেন আর সামনে মনিটরে এ একদিন থ্রিডি ইমেজ দেখতে পাবেন। তখন আর ভাবতে হবে না ড্রেস টা আপনাকে মানাবে কিনা! কি বিশ্বাস হচ্ছে না তো! তাহলে নিচের ভিডিও থেকেই দেখে নিন 🙂
দৃশ্যপট - ৩: আপনি একটা ড্রেস কিনতে মার্কেটে গেলেন। সেখানে গিয়ে একট ড্রেস পছন্দ হলো, কিন্তু দাম যে আপনার নাগালের বাইরে! কি আর করা ক্ষত বিক্ষত হৃদয়ে বাসায় ফিরে আসলেন। কিন্তু মার্কেটের ভিতরের খবর আপনি জানতেই পারলেন না। 🙂
ওকে আমি বলছি কি হয়েছে, আপনি হয়তোবা জানেন না যে জানালাতে লাগানো ওয়াইফাই সেন্সর আপনার স্মার্টফোনটিকে স্ক্যান করে নিয়েছে এর মধ্যে অথবা আপনার মোশন কে ডিটেক্ট করেছে।  কতজন দাঁড়িয়েছিলেন সেই ডিসপ্লের সামনে, কতজন এরপর দোকানে ঢুকেছেন আর কতজন ঢোকেননি – তার কাউন্ট ডাউন চলে যাচ্ছে দোকানির ডাটাবেসে । কতক্ষণ দাড়িয়েছিলেন ক্রেতা তার উপর নির্ভর করছে দামটা যুতসই হয়েছে কিনা। আর এভাবেই তারা  গ্রাহকের ক্রয় করার অভ্যাসগুলির উপর ভিত্তি করে পণ্যের দাম নির্ধারণ করে থাকে।
দৃশ্যপট - ৪: ওকে আপনি একজন পুরোদস্তর গবেষক। তো গবেষণা করতে করতে মেয়েদের দিকে তাকানোর সময় পাননি। কিন্তু বেলা যে পড়ে এলো, জলকে চলো! তাই বহুকষ্টে একটা পাত্রী যোগাড় করলেন। যেভাবেই হোক বালিকার মন জয় করতেই হবে। ইয়েস, এ ক্ষেত্রে আপনাকে বিগ ডাটা সাহায্য করতে পারেন। আই রিপিট, বিগ ডাটা! যেহেতু মেয়েদের সাথে আপনি অভ্যস্ত না, তাই আপনি সহজে বুঝতে পারবেন না মেয়েটা কি পছন্দ করে, তার সাথে কেমন ব্যবহার করতে হবে, আপনার আচরণে সে বোরড হয়ে যাচ্ছে কিনা, আলোচনার টপিক চেঞ্জ করতে হবে কিনা এমনকি এই সময়ে তার হাত ধরতে হবে কিনা তাও বিগ ডাটা মেয়েটির ফেইস এবং আচরণ মুভমেন্ট দেখে আপনাকে জানিয়ে দেবে। জানি বিশ্বাস হচ্ছে না, অবিশ্বাসীদের জন্য নিচের ভিডিও টি 😀
 
দৃশ্যপট - ৫:  আমরা অনেকেই অনলাইনে শপিং করে থাকি , কারণ অনেক সময় বেঁচে যায়। তো ধরেন, আপনি daraz থেকে শপিং করেন, daraz কিন্তু ঠিকই মনে রাখছে আপনি গত মাসে কি শপিং করেছেন,কোন প্রোডাক্ট গুলোতে আপনি ভিজিট করেছেন , কোন প্রোডাক্ট পেজে কতক্ষন ছিলেন ? আপনি হয়তো একটা আপেল কিনবেন , তারা আপনাকে সাজেস্ট করবে ওই আপেল রাখতে হলে একটা ফ্রিজ কিনতে, অথবা তারা আপনাকে অন্যান্য ফল সাজেস্ট করবে, এমনকি পুষ্টিমান সহ!  তারা কিন্তু  আপনার পছন্দের জিনিস গুলোই কিনতে সাজেস্ট করবে কারণ তারা আপনার আগের নানান ব্যবহার থেকে জানে আপনি কি লাইক করেন !
তাহলে বুঝতেই পারছেন কিভাবে বিগডাটা আমাদের প্রতিদিন পরম বন্ধুর মতো সাহায্য করতে পারে! দৃশ্যপট গুলোতে বাস্তব জীবনে বিগ ডাটার এনালাইটিকেল পাওয়ার বুঝানোর জন্য জাস্ট  ভিজুয়াল কিছু উদাহরণ দিয়েছি। আমাদের জীবনে প্রায় প্রতিটা ক্ষেত্রে বিগডাটা ব্যবহার করা যেতে পারে এবং এই প্রযুক্তি ব্যবহার করে রাতারাতি পৃথিবীর পুরো চেহারাই বদলে দিতে পারে। তাহলে নিশ্চইয় এতক্ষণে বুঝে গিয়েছেন কেন আমরা বিগ ডাটা সম্পর্কে জানবো  এবং কেন বিগ ডাটা এত গুরুত্বপূর্ন!

বিগ ডাটার ব্যবহারঃ

উপরে আমরা বিগ ডাটার প্রয়োজনীয়তা বুঝানোর জন্য কয়েকটি দৃশ্যপট  নিয়ে আলোচনা করেছিলাম। এবার বিভিন্ন ক্ষেত্রে বিগ ডাটার ব্যবহার নিয়ে আলোকপাত করবো।
সরকারি কাজেঃ যখন সরকারি সংস্থাগুলি চারপাশ থেকে সংগ্রহ করা তথ্যগুলো তথ্য বিশ্লেষণ করতে ও প্রয়োগ করতে সক্ষম হবে তখন ট্র্যাফিক নিয়ন্ত্রণ কিংবা অপরাধ নিয়ন্ত্রন  করার কাজে বিগ ডাটাকে চমৎকার ভাবে ব্যবহার করা যাবে। তবে বিগ ডাটার অনেক সুবিধা থাকলেও সরকার ডাটার স্বচ্ছতা ও গোপনীয়তার বিষয়গুলি খুব ভালো ভাবে এবং অত্যন্ত সতর্কতার সাথে নিয়ন্ত্রণ করতে হবে।
নিচের ভিডিওটি দেখলেইন ব্যাপারটি পুরোপরি বুঝা যাবে। 🙂
অন্যদিকে, IBM তো অনেক আগেই দেখে দিয়েছে পুলিশ কিভাবে অপরাধ হওয়ার আগেই ঘটনাস্থলে পৌঁছে যাচ্ছে । ওখানে গিয়ে অপরাধ যে করতে চাই তার দিকে ফ্রেন্ডলি ভঙ্গিতে চেয়ে কফির অফার । এভাবে সরকারের স্বরাষ্ট্র এবং প্রতিরক্ষা মন্ত্রণালয়  অনেক দূর্ঘটনার হাত থেকে দেশের মানুষকে উদ্ধার করতে পারবে। বিস্তারিত  জন্য ভিডিওটা দেখতে পারেন !
২০১২ সালে ওবামা প্রসাশন  Big Data Research and Development Initiative প্রকল্পের ঘোষণা দিয়েছেন। এই প্রকল্প দেশের সৃষ্টি বিভিন্ন সমস্যার সমাধান অনুসন্ধান করে। ৬ টি বিভাগের অধীন প্রায় ৮৬ টি বিগ ডাটা প্রোগ্রাম এই প্রকল্পে ব্যবহৃত হয়েছিলো। একই বছর অর্থাৎ  ২০১২ সালে বারাক ওবামা প্রসাশনের পুনরায় ক্ষমতা দখল এবং  ২০১৪ সালে ভারতের বিজেপি২৩ বছর পর ক্ষমতায় আসার অন্যতম প্রধান নিয়ামক ছিলো বিগ ডাটা। দু দলই তাদের নির্বাচনী প্রচারনায় ভোটারদের মানসিকতা নির্ণয়ে বিগ ডাটার প্রয়োগ ঘটিয়েছেন। এছাড়া ভারতের নির্বাচনী ব্যবস্থায় সাধারণ জনগণের পর্যবেক্ষন এবং বিভিন্ন নীতিতে পরামর্শ প্রদানের ক্ষেত্রেও বিগডাটা ব্যবহার করা হয়।  ( সূত্র- উইকিপিডিয়া)
পণ্য উৎপাদনেঃ বর্তমান তীব্র প্রতিযোগীতার মার্কেটে সর্বনিম্ন খরচে গুণগতমান সম্পন্ন প্রোডাক্ট তৈরি করা খুবই গুরুত্বপূর্ণ একটি কাজ। সমস্যার দ্রুত সমাধান এবং দ্রুত যেকোন বিষয়ে সিদ্ধান্ত নিতে নির্মাতারা অনেক অ্যানালাইটিকেল প্রক্রিয়ার মধ্য দিয়ে যাচ্ছে। এসব ক্ষেত্রে বিগ ডাটা খুব গুরুত্বপূর্ন ভূমিকা পালন করে।
Lets see the following video 🙂
ব্যাংকিং খাতেঃ   ব্যাংকিং খাতে বিগ ডাটা এনালাইসিস অনেক প্রয়োজনীয় ভূমিকা পালন করে। একটা সহজ উদাহরণ হলো, ক্রেডিট বা ডেবিট কার্ডের জালিয়াতি রোধ। কার্ডের ব্যবহারের ধরণ এবং মালিকের এর ব্যবহারের ধরণ থেকে কম্পিউটার বুজে নিতে পারে যে কোন জালিয়াতি হচ্ছে কিনা বা সম্ভাবনা কতটুকু। এ ছাড়া কোন কাস্টমারকে কেমন সুবিধা দেয়া উচিত, কোন কাস্টমার বেশি বিশ্বাসযোগ্য (লোন দেয়ার ক্ষেত্রে) এইসব তথ্য জানা সম্ভব বিগ ডাটা এনালাইসিস থেকে।
শিক্ষা খাতেঃ  তথ্যভিত্তিক গবেষণা করে শিক্ষা প্রতিষ্ঠানগুলো স্কুল, সিস্টেম, ছাত্র এবং পাঠ্যক্রমের উপর উল্লেখ্যযোগ্য প্রভাব রাখতে পারে। বিগ ডেটা ব্যবহার করে তারা ঝুঁকিপূর্ণ ছাত্রছাত্রীদের চিহ্নিত করতে পারেন। এছাড়া ছাত্রছাত্রীদের অগ্রগতি, শিক্ষক-শিক্ষিকাদের মূল্যায়নের মাধ্যমে  শিক্ষা ব্যবস্থার পরিবর্তন এবং উন্নয়ন করাও সম্ভব।
স্বাস্থ্য খাতেঃ  কেমন হবে যদি কিছুদিন পরে  আপনি নানান ওয়েবসাইটে দেখতে পান যে ওরা আপনাকে নানান স্বাস্থ্য পরীক্ষা বা খাবার দাবার এর বিষয়ে সাজেশন দিচ্ছে! অবাক হলেও এমনটাই হবে কিছুদিনের মাঝে। আপনার খাবারের অভ্যেস, ঘুমের অভ্যেস, ডিভাইস বা নানান ওয়েবসাইট ব্যবহারের তথ্যের উপরে ভিত্তি করে নানান সাজেশন দেয়া, আগে থেকে রোগ সম্পর্কে ধারণা করা, এবং দ্রুত চিকিৎসা নেয়ার জন্য বিগ ডাটা ভালো অবদান রাখবে। এর জন্য ইতিমধ্যেই শুরু হয়ে গেছে নানান কাজ। এছাও খাবারের গুণগত মান, পুষ্টি, নানান রোগ সম্পর্কে গবেষণা (যেমন: ক্যান্সার), এবং রোগীর তথ্য সংরক্ষণ ইত্যাদি কাজে ব্যবহৃত হচ্ছে বিগ ডাটা।
নিচের ভিডিও থেকে আরো ধারণা পাওয়া যেতে পারে:

Internet of Things (IoT):

আমরা বিভিন্ন সোর্স থেকে ডাটা পেয়ে থাকি। অর্থাৎ বিভিন্ন ওয়েব, বিজনেস কিংবা অ্যাপ্লিকেশন থেকে আমরা ডাটা পাই। কিন্তু এসবের বাইরে ও একটা টার্মিনোলজি আছে, যা থেকে আমরা হিউজ ডাটা লাভ করে থাকি। আর সেটা হলো ইন্টারনেট অব থিংস (IoT) । নিচে দেয়া IBM এর ভিডিও দেখলেই এর প্রভাব সম্পর্কে মোটামুটি একটা ধারনা পাওয়া যাবে।

একটু পুরোনো গল্পে ফিরে যাই,
২০০৭ সালে Minnesota তে একটা ব্রীজ ভেঙ্গে যাবার কারণে অনেক মানুষ মারা যায়। ব্রীজে ব্যবহৃত স্টিলের প্লেটগুলো সঠিকভাবে লোড নিতে না পারার কারণে ব্রীজটি ভেঙ্গে পড়েছিলো। কথা হচ্ছে এই অবস্থা থেকে কিন্তু চাইলেই আমরা নিস্তার পেতে পারতাম। কিভাবে?
ব্রীজটি পুনরায় নির্মাণ করার সময় আমরা এমন এক ধরণের স্মার্ট টেকনোলজি ( হতে পারে স্মার্ট সিমেন্ট) ব্যবহার করতে পারি যা ব্রীজের উপর প্রযুক্ত চাপ, ব্রীজের ফাটল এবং সংকোচন-প্রসারণ মনিটরিং করতে পারবে। এই সিস্টেমটি আগাম বিপর্যয়ের সংকেত দিবে এবং সে অনুযায়ী ব্যবস্থা ও নেয়া যাবে। বাংলাদেশ সরকারের সড়ক বিভাগের কর্মকর্তাদের মাথায় এই বিষয়টি ঢুকিয়ে দিতে পারলেই কেল্লা ফতে। আরমসে লং ড্রাইভে যাওয়া যাবে 😀

আমরা আবার Minnesota তে ফিরে যাই। মেনে নিলাম যে উপরোক্ত সিস্টেম প্রয়োগ করে আমরা ব্রীজকে দূর্ঘটনার হাত থেকে বাঁচাতে পারবো। কিন্তু যদি আমেরিকার মতো একটি শীতপ্রধান দেশে প্রচুর তুষারপাতের কারণে ব্রীজে বরফ জমে! এই সমস্যা কিভাবে দূর করা যাবে?
তখন ঐ একই সেন্সর জমাটবদ্ধ বরফকে ডিটেক্টকরে ইন্টারনেট এর মাধ্যমে যানবাহনের সাথে কমিউনিকেট করবে। যখন যানবাহন জানতে পারবে সামনে বিপত্তি আছে তখন যানবাহন ড্রাইভারকে আস্তে চালাতে নির্দেশ দিবে । এটা একটা রিয়েল টাইম সিস্টেম যা কিনা sensor to machine ও machine to sensor এর মধ্যে যোগাযোগ করবে ঐ একই প্লেসে, একই সময়ে।

এখনতো ট্র্যাফিক আর স্ট্রিট কন্ডিশন ড্রাইভারের সাথে কমিউনিকেট করে যা আশেপাশের ঘনবসতিপূর্ণ এলাকা, বরফ জমা রাস্তা কিংবা রাস্তার সংস্কারের জন্য বন্ধ থাকা রাস্তাসহ সবকিছু সেন্সর রি-রাউটিং করে ড্রাইভারকে ইনফরম করবে।

কাজেই, আমাদেরকে ডাটা শর্ট করে মনিটরিং ও ট্র্যাকিং করতে সাহায্য করছে সেন্সর । আর Cloud based apps আর্টিফিশিয়াল ইন্টেলিজেন্স এর মাধ্যমে ডাটাকে মেশিন কিংবা মোবাইল এ রেয়াল টাইম রেসপন্স করবে । আমরা আশা করতেই পারি, ঢাকা সিটিকে খুব শীঘ্রই স্মার্ট সিটি হিসাবে দেখবো। এতক্ষণ, IoT নিয়ে বকবক করলাম দেখে আসি এটার সাথে বিগ ডাটার কি সম্পর্ক !

বিভিন্ন রকম ডিভাইস, মেশিন,সেন্সর, ওয়েব লগ ইত্যাদির ডাটা গুলো জেনারেট হয় আমরা সবাই জানি। এই ডাটাগুলো অবশ্যই ম্যাসিভ ডাটা , আন-স্ট্রাকচার্ড, সেমি-স্ট্রাকচার্ড কিংবা স্ট্রাকচার্ড এবং ডাটাগুলো বিভিন্ন ধরণের।  কাজেই আমরা বলতে পারি IoT থেকে প্রাপ্ত ডাটাগুলো বিগ ডাটা।  আর এই বিগ ডাটা এনালাইসিস করেই এমন রিয়েল টাইম ডিসিশন নিতে পারি আমরা।
 সাধারণ ক্রয়-বিক্রয়ে বিগ ডাটা অসামান্য অবদান রাখছে। বিশ্ববিখ্যাত ওয়ালমার্টের কথা কে না জানে! সেই ওয়ালমার্ট প্রতি ঘণ্টায় ১ মিলিয়নের বেশি ক্রেতার সাথে লেনদেন করে যা ২.৫ পেটাবাইটসের (২৫৬০ টেরাবাইটস) চেয়েও বেশি ডেটা ইমপোর্ট করে। এই ডাটা US Library of Congress এর সমস্ত বইয়ের সব ইনফরমেশনের ১৬৭ গুণের সমান। ভাবা যায়! ওয়ালমার্ট নিয়ে একটি মজার ঘটনা আছে। ওরা ডাটা এনালাইসিস করে দেখতে পায় যে, প্রতি উইক এন্ডের আগের দিন বিয়ার এবং প্যাম্পার বিক্রি বেড়ে যায়। এখন প্রশ্ন হলো, এই দুইটার মাঝে সম্পর্ক কি এবং কিভাবে এটাকে ব্যবহার করা যায়। ওরা যা করলো তা হলো, কাছাকাছি র‍্যাকে বিয়ার এবং প্যাম্পার রেখে দিলো। ফলে প্যাম্পারের বিক্রি আরো কয়েকগুণ বেড়ে গেল। কারণটা হচ্ছে, এই দিন সাধারণত পুরুষরা যায় বিয়ার কিনতে ছুটির মজা নেয়ার জন্য। বাসা থেকে মায়েরা বলে দেয় প্যাম্পার নিয়ে আসতে। তাই যদি দুইটা কাছাকাছি থাকে তাহলে সহজেই মনে থাকে এবং নিয়েও আসতে তেমন কষ্ট হয়না। দূরে থাকলে যেহেতু অন্য দিকে গিয়ে নেয়া কষ্ট তাই নেয়া কম হতো। দুইটা কাছাকাছি রাখার পর এইজন্য বিক্রি হুট করে বেড়ে যায়।
এছাড়া বিজ্ঞানের বিভিন্ন গবেষণার ক্ষেত্রে বর্তমানে প্রচুর পরিমাণে বিগ ডাটার ব্যবহার হচ্ছে। বিশেষ করে জীব প্রযুক্তি, ডিএনএ ডাটাবেজে, হিউমেন জিনোম, ফ্লুয়িড ডায়নামিকস থেকে শুরু করে নাসার বিজ্ঞানীরাও বিগ ডাটা ব্যবহার করছে।

অন্যদিকে খেলার মাঠেও বিগ ডাটা পিছিয়ে নেই। প্রতিপক্ষের খেলোয়ারদের সম্পর্কে বিস্তারিত তথ্য নেয়া থেকে শুরু করে বিভিন্ন রেসে এনার্জি লেভেল চেক করার কাজেও বিগ ডাটা ব্যবহার করা হয়।

টেকনোলজির সাথে বিগ ডাটাকে নতুন করে পরিচয় করিয়ে দেবার মতো কিছু নেই। ফেসবুক, গুগল ও আমাজনের মতো জায়ান্ট টেক প্রতিষ্ঠানগুলো ইতিমধ্যে বিগ ডাটাকে কাজে লাগিয়ে নতুন নতুন প্রযুক্তি উদ্ভাবন করেছে। এদের সার্ভারে প্রতিদিন বিলিয়ন বিলিয়ন ডেটা জমা হচ্ছে এবং এতসব তথ্যের মধ্যেও কাঙ্খিত তথ্য খুঁজে পেতে মাত্র কয়েক সেকেন্ড সময় লাগে যা কেবল মাত্র বিগ ডাটার কারণেই সম্ভব হয়েছে। ফেইস রিকগনিশন, ভয়েস রিকগনিশন, ভয়েস সার্চ, ফিঙ্গারপ্রিন্ট আর ও কত কি!

অনেক তো হলো। এতক্ষণে নিশ্চইয় আমরা বুঝে গিয়েছি বিগ ডাটা কিভাবে আমাদের জীবনকে রাতারাতি চেঞ্জ  করে দিতে পারে এবং দিচ্ছে। আপনি যদি ডাটা ভালোবাসেন, তবে বিগ ডাটা আপনার জন্য। আগামী বিশ্ব হবে ডাটা সায়েন্টিস্টদের। আর এক্ষেত্রে সায়েন্টিসরা প্রধান অস্ত্র হিসেবে ব্যবহার করবে বিগ ডাটাকেই। 🙂

রেফারেন্স ( Reference) : 

  1. https://en.wikipedia.org/wiki/Big_data
  2. https://www.oracle.com/big-data/index.html
  3. https://www.sas.com/en_us/insights/big-data/what-is-big-data.html
  4. http://searchcloudcomputing.techtarget.com/definition/big-data-Big-Data
  5. https://www.priyo.com/blog/2012/03/29/3223.html
  6. http://www.banglanews24.com/information-te
  7. chnology/news/bd/593033.details
  8. http://youthcarnival.org

 

Revisioned by Md. Yasin Kabir

লিখাটি নিয়ে আপনার অভিমত কি?

SHARE