Stata কেন শিখবেন?

১৯৮৫ সালে StataCorp নামের একটি কোম্পানি Stata নামের এই স্ট্যাটিস্টিক্যাল সফটওয়্যার প্যাকেজটি তৈরি করে। Stata’র পূর্ণরূপ হল Statistics+Data। বেশিরভাগ ক্ষেত্রে গবেষণায়, বিশেষ করে অর্থনীতি, সমাজবিজ্ঞান, রাষ্ট্রবিজ্ঞান, বায়োমেডিসিন, জনস্বাস্থ্য ও এপিডেমিওলজিতে Stata প্রচুর ব্যবহার করা হয়। 

Stata শিখবেন কিনা অথবা কেন শিখবেন তা ভাবছেন? তাহলে এই লেখাটি আপনার জন্য।

Stata’র জনপ্রিয়তা

ডেটা সায়েন্সে ব্যবহৃত সফটওয়্যারগুলির জনপ্রিয়তা নিয়ে Robert A. Muenchen যুক্তরাষ্ট্রের প্রেক্ষাপটে একটি পর্যালোচনা করেন। তাঁর পর্যালোচনা অনুযায়ী ডেটা সায়েন্স চাকরির বাজারে সফটওয়্যার হিসেবে Stata’র অবস্থান ২১ তম এবং এর জনপ্রিয়তা দিন দিন বাড়ছে। ২০১৭ সালের তুলনায় ২০১৯ সালে ডেটা সায়েন্সের চাকরিগুলোর মধ্যে Stata স্কিল লাগবে এমন চাকরির সংখ্যা ৫০ শতাংশ বেড়েছে। এই অগ্রগতির দিক দিয়ে Stata ১৫ তম। প্রকাশিত গবেষণাপত্রের সংখ্যার ভিত্তিতে Stata’র অবস্থান ৪র্থ (১ম, ২য় ও ৩য় অবস্থানে রয়েছে যথাক্রমে SPSS, R এবং SAS)। 

স্ট্যাটিস্টিক্যাল বিষয় নিয়ে প্রশ্নোত্তর আলোচনা হয় এমন দুইটি সাইট হল Cross validated এবং Talk stat। এগুলোতে থ্রেড বা প্রশ্ন সংখ্যার ভিত্তিতে সফটওয়্যারগুলোর ranking-এ Stata আছে ৩য় অবস্থানে, শীর্ষে আছে R। তবে Stata’র চেয়ে পিছিয়ে আছে MATLAB ও Python-এর মত ল্যাংগুয়েজ। R for Stata Users বইটিতে লেখক Muenchen এর মতে যেসব সফটওয়্যার পূর্ব-লিখিত মেথড ব্যবহার করে কাজ করে সেগুলোর মধ্যে R, SAS, SPSS এবং Stata রয়েছে শীর্ষে। জ্ঞানের এগারটি শাখায় Stata’র ৫০টিরও বেশি ধরনের ফিচার ব্যবহার করা হয়। 

চলুন জেনে নিই Stata’র জনপ্রিয়তা ছাড়াও আর কী কী ফিচারের কারণে আপনার Stata শেখা উচিত।

রি-প্রডিউসিবিলিটি (Reproducibility)

Stata’র যেকোনো কাজ Reproducible। অর্থাৎ শত শত লাইনের কোড একবার লেখা হয়ে গেলে নিমিষেই তা যতবার ইচ্ছা রান করে একই আউটপুট পাওয়া যায়, নতুন করে কোড আবার লেখার প্রয়োজন হয় না। গবেষণায় Reproducibility অত্যন্ত গুরুত্বপূর্ণ। কারণ এর মাধ্যমে গবেষণার স্বচ্ছতা, শুদ্ধতা ও বিশ্বাসযোগ্যতা নির্ধারণ করা যায়। অরিজিনাল ডেটা থেকে কীভাবে ফাইনাল রেজাল্ট পাওয়া গেল, অর্থাৎ গবেষণায় ঠিক কী কী করা হয়েছে তার পুরো workflow সংরক্ষণ করা যায় do file-এ।

Stata website এর মতে স্ট্যাটিস্টিক্যাল সফটওয়্যারগুলির মধ্যে একমাত্র Stata’তেই Integrated versioning মেনে চলা হয়। অর্থাৎ ১৯৮৫ সালে Stata’তে যে কোডটি লেখা হয়েছে তা আজও রান করবে এবং ভবিষ্যতেও রান করে একই রেজাল্ট দেবে। পূর্বে সেইভ করে রাখা কোড পরে আবার রান করে একই রিপোর্ট বা গ্রাফ রি-ক্রিয়েট করা যায়। অটোমেটেড রিপোর্ট মাইক্রোসফট ওয়ার্ড, এক্সেল, পিডিএফ সবই সাপোর্ট করে। Stata’তে পাবলিকেশন-কোয়ালিটির গ্রাফ এবং অটোমেটেড রিপোর্ট তৈরি করা সম্ভব।

আরও পড়ুনঃ Stata ব্যবহারের ৫টি দরকারি টিপস

কম্প্যাটিবিলিটী (Compatibility)

Stata’তে Excel, CSV, SAS বিভিন্ন ধরনের ডেটাফাইল সরাসরি ইম্পোর্ট করা যায়। Stata’র যেকোনো ভার্সন তার চেয়ে পুরোনো কোনও ডেটাসেট ওপেন করতে পারে। কিন্তু তার চেয়ে নতুন কোনও ভার্সনে তৈরিকৃত ডেটাসেট ওপেন করতে সমস্যা হতে পারে। কারণ সময়ের সাথে ফাইল ফরম্যাটে পরিবর্তন এসেছে। এই সমস্যাটরও সমাধান করে ফেলেছে saveold নামের একটি সহজ ইউজার-রিটেন কমান্ড, যার মাধ্যমে যেকোনো Stata ডেটাসেট পুরোনো ভার্সনের ফরম্যাটে সেইভ করে ফেলা যায়।

এ তো গেল Data format compatibility। Cross platform compatibility’র দিক দিয়েও Stata অনেক এগিয়ে। Windows, Mac এবং Linux তিন ধরনের অপারেটিং সিস্টেমেই Stata চালানো যায়, তাও আবার একই লাইসেন্স ব্যবহার করে। কারণ Stata’র লাইসেন্স Platform specific নয়। Stata’র ডেটাসেট সহ যাবতীয় কিছু কোনরকম ট্রান্সলেশন ছাড়াই তিন ধরনের প্ল্যাটফরমে শেয়ার করা যায়।

কমিউনিটি (Community)

Stata’র ব্যবহারকারী কমিউনিটি কতটা শক্তিশালী তা বোঝার জন্য তিনটি বিষয় উল্লেখ করাই যথেষ্ঠঃ User-written packages, Statalist এবং Stata Journal। Stata’র ব্যবহারকারীরা প্রোগ্রামিং-এর মাধ্যমে নতুন নতুন কমান্ড প্যাকেজ তৈরি করে Stata’য় নতুন ফিচার যুক্ত করতে পারেন। প্যাকেজগুলো সহজেই ইন্সটল করে নিলে Stata’র বিল্ট-ইন কমান্ডগুলোর মতই ব্যবহার করা যায়। Stata’র এরকম শত শত Community-contributed commands রয়েছে। 

Statalist নামের email list টি চালু হয় ১৯৯৪ সালে। বর্তমানে এটি Stata’র অফিসিয়াল discussion forum। যখন এই লেখাটি লিখছি ঠিক সেই মূহুর্তে বিশ্বব্যপী ১২০৫ জন ব্যবহারকারী Statalist-এ অনলাইনে আছেন। এখন পর্যন্ত সর্বোচ্চ সংখ্যক ব্যবহারকারী অনলাইনে ছিলেন ৫৬৭৩ জন,গত ১৫ই জানুয়ারিতে। Stata ব্যবহারকারীর সংখ্যা এ থেকে আন্দাজ করা যায়। এখন পর্যন্ত এই ফোরামে ২ লাখ ৯৮ হাজারেরও বেশি পোস্ট করা হয়েছে।

Stata Journal একটি ত্রৈমাসিক প্রকাশনা যেখানে Stata language কার্যকরভাবে ব্যবহার করা হয়েছে এমন প্রবন্ধ প্রকাশিত হয়। Peer-reviewed paper ছাড়াও Stata সংক্রান্ত বিভিন্ন শর্ট নোট, টিচিং মেথড, কলাম, মন্তব্য, বুক রিভিউ এখানে প্রকাশিত হয়। Stata ব্যবহারকারী গবেষকদের জন্য Stata Conference অসাধারণ এক মিলনমেলা। যুক্তরাষ্ট্রে প্রতি বছর Stata Conference অনুষ্ঠিত হয়। পাশাপাশি আরও প্রায় ২০টি দেশে Stata distributors-রা বিভিন্ন সময়ে গ্রুপ মিটিং আয়োজন করেন। কোভিড-১৯ এর কারণে পরবর্তী Stata Conference এ বছর আগস্টে ভার্চুয়ালি অনুষ্ঠিত হবে। এছাড়াও Stata’র রয়েছে নিজস্ব Blog যেখানে Stata developers নিজেরাই লিখে থাকেন।

রিসোর্স (Resources)

কাজ করতে গিয়ে কোনও কমান্ড ভুলে গিয়েছেন? সমাধান হাতের নাগালে, Stata Manual, যাকে Stata বলে PDF Documentation। Stata’র  সর্বশেষ সংস্করণ Stata 16-এ এই Documentation ১৫,০০০ পৃষ্ঠা দীর্ঘ! এই দীর্ঘ ম্যানুয়ালে Stata’র প্রত্যেকটি ফিচার মেথড ও উদাহরণসহ বর্ণনা করা আছে। এটি অনলাইনে Stata Website-এ গেলে পাবেন, অথবা আপনার কম্পিউটারের Stata Interface থেকেই সরাসরি এক্সেস করতে পারবেন।

Stata’র Help menu-তে PDF Documentation-এর অপশনটি খুঁজে পাবেন। কিন্তু এত বড় documentation থেকে আপনার কাঙ্ক্ষিত ফিচার খুঁজে পাওয়া বেশ কষ্টসাধ্য। এই কাজকে আরও সহজ করতে Help মেনুতে রয়েছে Search অপশন।

Serach অপশন কীভাবে ব্যবহার করতে হয় তা বর্ণনা করা আছে Help মেনুর Advice অপশনে। এরপরও সমস্যার সমাধান খুঁজে না পেলে Statalist তো আছেই!

এছাড়া Stata নিয়ে লেখা বইগুলো দেখতে ঘুরে আসতে পারেন Stata Bookstore থেকে।

Stata ব্যবহার করা যেমন সহজ তেমনই বিশ্বাসযোগ্য। কারণ Stata সফটওয়্যারের প্রতিটি কমান্ড পরিসংখ্যানবিদ টিম দ্বারা পরীক্ষিত। প্রতিটি Stata ৩২ লাখ লাইন কোডের ৪৯ লাখ লাইন আউটপুট দিয়ে পরীক্ষা করা হয়। তাই ডেটা সংক্রান্ত সকল কাজ দ্রুততার সাথে নির্ভুলভাবে করতে Stata-ই হয়ে উঠুক আপনার পছন্দের সফটওয়্যার!

Stata For Statistics & Data Analysis বাংলা কোর্স!

Stata ব্যবহার করে যেকোনো সেক্টরের (Business, Science, Social Science, Medical, Engineering, etc.) ডেটাই এনালাইসিস করা সম্ভব। এই কোর্সে আপনাকে Stata-র সাথে পরিচয় করিয়ে দেয়া হবে; প্রতিটি Command ব্যখ্যাসহ আলোচনা করা হবে যাতে আপনারা আপনাদের কাজের প্রয়োজনে নিজে থেকেই Command তৈরি করতে পারবেন। কোর্সটি করা শেষ হলে দেখবেন Data Analysis বা Research সম্পৃক্ত যেকোনো কাজের জন্য Stata-ই হবে আপনার পছন্দের Software!!

শেয়ার করুন

Leave a Comment