दुसऱ्या जागतिक महायुद्धाच्या दरम्यान मित्रराष्ट्रांच्या फळीला जर्मनीच्या युद्धक्षमतेचा अचूक अंदाज बांधायला संख्याशास्त्राचा उपयोग झाला, त्याचीच ही गोष्ट. पहिल्या आणि दुसऱ्या जागतिक महायुद्धांमध्ये लढाऊ वाहनांमध्ये रणगाड्यांची महत्त्वाची भूमिका होती. पहिल्या महायुद्धाच्या तुलनेत दुसऱ्या महायुद्धाच्या वेळी तांत्रिकदृष्ट्या रणगाडे अधिक प्रगत झाले होते. विशिष्ट, विविध कामांसाठी वेगवेगळे लढाऊ रणगाडे विकसित झाले होते. मित्रराष्ट्रांना त्यांच्याकडच्या रणगाड्यांच्या तांत्रिक बाजूविषयी खात्री होती, परंतु नवीन पद्धतीने विकसित केलेल्या जर्मन पॅंथर (Panther or Panzer V or mark V) रणगाड्यांच्या विषयी मात्र त्यांना अंदाज घेणं जरूरी होतं. त्यांना अशी कुणकुण लागली होती की जर्मनांच्या बाजूने विशिष्ट प्रकारच्या पॅंथर रणगाड्याचा खूप जास्त वापर होतो आहे. एकूण किती पॅंथर रणगाड्यांचं जर्मनाच्या बाजूला उत्पादन होत असावं याची संदिग्धता मित्रराष्ट्रांना होती. आता, याचा अंदाज कसा बरं बांधायचा? गुप्तहेर संघटनांकडून मिळालेली माहिती, गुप्त संदेश डीकोड, आणि ताब्यात घेतलेल्या शत्रूपक्षाच्या सैनिकांची कसून चौकशी, या सगळ्यातून मिळालेल्या माहितीप्रमाणे पॅंथर रणगाड्यांच्या उत्पादनाचा अंदाज निघाला, की जून १९४२ ते सप्टेंबर १९४४ या कालावधीमध्ये दरमहा १४०० या विशिष्ट रणगाड्यांची निर्मिती झाली असावी. आता, हा आकडा बराच जास्त वाटत होता. हा आकडा जर खरा असेल, तर जर्मनांचं सामर्थ्य खूप जास्त असून Operation Neptune वर त्याचा गंभीर परिणाम होऊ शकला असता. मग यातली सत्यासत्यता पडताळून पाहणार तरी कशी? शत्रुपक्षाकडे एकूण किती रणगाडे असू शकतील हे जाणून घ्यायला काहीतरी दुसरा मार्ग शोधायला हवाच होता.
मित्रराष्ट्रांच्या सुदैवाने त्यांना युद्ध चालू असताना जर्मनीच्या या काही रणगाड्यांना ताब्यात घ्यायला आणि काही उध्वस्त करायला यश आलं होतं. त्यांच्या असं लक्षात आलं, की त्या प्रत्येक रणगाड्यावर एक विशिष्ट प्रकारचा अनुक्रमांक (सिरियल नंबर) आहे. एव्हढेच नव्हे, तर प्रत्येक रणगाड्याला असलेला गीयर बॉक्स, इंजिन, chassis यांना प्रत्येकी विशिष्ट क्रमांक आहे. प्रत्येक चाकालाही त्याच्या त्याच्या साच्यानुसार विशिष्ट अनुक्रमांक आहे. यापैकी इंजिन नंबर आणि chassis नंबर जरा क्लिष्ट असले, तरी गीयरबॉक्स वरचा अनुक्रमांक हा अतिशय उपयोगी पडला. तसेच चाकाच्या माहितीचा उपयोग फेरपडताळणीसाठी केला गेला. ते कसं आजमावता येऊ शकेल यासाठी एक प्रयोगादाखल उदाहरण घेऊयात.
असं मानू की १,२,३,.. N हे त्या सगळ्या रणगाड्यांचे क्रमांक दर्शवतात. आपले उद्दिष्ट हा ‘N’ जास्तीत जास्त किती असेल याचा अंदाज बांधण्यात आहे. समजा, यातले ४ रणगाडे ताब्यात घेण्यात यश आले, आणि त्यांचे अनुक्रमांक १७, ३२, ५६, ८१ असे आहेत. या sample size ला ‘k’ मानू. म्हणजेच इथे k = ४. Sample मधल्या सगळ्यात मोठ्या अनुक्रमांकाला ‘m’ नाव देऊ. इथे m = ८१. हे लक्षात घ्यायला हवं, की ८१ क्रमांक नमुन्यात समाविष्ट असल्याने N हा ८१ पेक्षा लहान असू शकत नाही. (इथे एक महत्त्वाचे गृहीतक गरजेचे ठरते की या नमुन्यामध्ये (sample) समाविष्ट होणारे क्रमांक १ ते N या श्रेणीत uniformly distributed (समसमान वितरित) असायला हवेत. असं नसेल तर काय होईल, तर नमुन्यात समाविष्ट संख्या एक विशिष्ट ठिकाणी clustered असतील, ज्यामुळे संभाव्य कमाल संख्येचा शोध बिकट होईल). इथे आपली समस्या sample maximum (इथे ८१) आणि population maximum (N) यांच्यातले अंतर अचूकरित्या मोजणे ही ठरते.
या माहितीचा एकंदरीत विचार करता सांख्यिकी पद्धतीने ‘N’ चा आकडा खालील सूत्राने काढता येतो.
N = (m-१)(k+१)/k = m + (m/k) – १ ......................... (टीप १ पहा)
N = ८१ + (८१/४) – १ = १००.२५
वरच्या उदाहरणाचा विचार करता साधारण १०० रणगाड्यांचे उत्पादन झाले असं अंदाज बांधता येतो.
आता तुम्ही म्हणाल हा अंदाज तरी बरोबर कशावरून? तर या सूत्राची उपयोगिता पाहण्यासाठी दुसरा एक प्रयोग करू शकतो. आपण एक कमाल आकडा निश्चित करू. समजा एकूण संख्या (N) ही २५० आहे. समजा त्यातले पाच क्रमांक (without replacement) नमुन्यादाखल घेतले. १०, ४३, ११५, १२३, २२७. म्हणजे N = २५० m= २२७ k= ५
N(estimated) = २२७ + (२२७/५) - १ = २७१.४
फक्त ५ नमूना संख्यांच्या आधारावर हा आडाखा २५० च्या बऱ्यापैकी जवळ जाणारा आहे. (टीप २ पहा)
तर... वरील सूत्र वापरुन मित्रराष्ट्रांचा आडाखा असा होता की साधारणपणे दरमहा सरासरी कमाल २४६ रणगाड्यांची निर्मिती होत असावी. युद्ध संपल्यानंतर जेव्हा विविध दस्तावेज अभ्यासण्यात आले तेव्हा समोर आलेला उत्पादनाचा आकडा दरमहा सरासरी २४५ होता!
उदाहरणादाखल काही विशिष्ट महिन्यांच्या उत्पादनाची माहिती खालीलप्रमाणे:
Month |
Statistical estimate |
Intelligence estimate |
German records |
June 1940 |
169 |
1,000 |
122 |
June 1941 |
244 |
1,550 |
271 |
August 1942 |
327 |
1,550 |
342 |
मित्रराष्ट्रांनी शत्रूची ताकद आजमावायला हातातल्या माहितीचा संख्याशास्त्राच्या मदतीने चातुर्याने उपयोग करून घेतला. गुप्तहेर यंत्रणा आदी पारंपरिक पद्धतीपेक्षा सांख्यिकी अनुमान या बाबतीत वरचढ ठरले. रणगाड्यांच्या उत्पादनाचे अनुमान लावण्याची ही समस्या सांख्यिकी जगतात ‘जर्मन टॅंक प्रॉब्लेम’ या नावाने प्रसिद्ध आहे. या अनुमान पद्धतीचा उपयोग केवळ रणगाड्यांच्या उत्पादनापुरताच सीमित राहिला नाही, तर जर्मनांचे इतर क्षेत्रातले बळ, त्यांच्याकडच्या विविध कारखान्यांची संख्या, सप्लाय चेन आणि इतर अनेक उत्पादनांमधले बदल टिपायला मित्रराष्ट्रांनी करून घेतला! ‘युद्ध’ म्हटल्यावर आपल्या डोळ्यासमोर रणांगणावर लढणारे सैनिक, बंदुका, तोफा, विमाने, बॉम्ब हेच डोळ्यासमोर येतात, परंतु हे वरचे उदाहरण पाहता युद्धात या सर्वांच्या जोडीला कूटनीती यशस्वी होण्याकरिता संख्याशास्त्राने महत्त्वाची भूमिका बजावलेली दिसते.
टीप १ :सूत्र १ हे संख्याशास्त्रातल्या निकषानुसार Minimum Variance Unbiased Estimator (MVUE) हा गुणधर्म दाखवते. हे काय असतं, तर आता समजा ‘N’ ही संख्या शोधण्यासाठी सूत्र १ बरोबर आणखी काही सूत्रांची तुलना केली, तर सूत्र १ हे ‘N’ चा ही संख्या शोधण्यासाठी सूत्र १ बरोबर आणखी काही सूत्रांची तुलना केली, तर सूत्र १ हे ‘N’ त्यातल्या त्यात अचूक अंदाज सुचवते.
टीप २ : इथे हे लक्षात घेणं जरूरी आहे, की आपल्या मनात आधीच कमाल २५० हा आकडा असल्यामुळे त्याच्या तुलनेत २७१ हा अंदाज जास्त वाटू शकतो. परंतु २५० माहीत नसणे हे नीट लक्षात घेतलं तर हा अंदाज फारसा विपरीत नाही. जर मूळ N हा प्रचंड मोठा आकडा असेल तर m निश्चित बदलेलच, परंतु इथेही मग sample साइजमध्ये एखाद्या जास्तीच्या संख्येने निष्कर्षाच्या गुणवत्तेत जास्त चांगला फरक पडू शकतो.
संदर्भ:
https://en.wikipedia.org/wiki/German_tank_problem
Nice post Meghana! Khup ranjak paddhatini lihila ahes he. Maja aali wachun :)
ReplyDeleteCurious to know about how many tanks British actually captured and how that improved their estimate of 246 (which was so remarkably close to 245, the actual number!!)
A small correction: Approx. line no 21 madhye 'Jar' 2 wela alay
थॅंक यू रे! चांगला प्रश्न आहे. पण त्याचं उत्तर निश्चित देता येणार नाही. एक लक्षात घ्यायला हवं की त्यांनी अमुक इतके ताब्यात घेतले किंवा उद्ध्वस्त केले हा आकडा, त्यांनी प्रत्यक्ष किती नमुन्याच्या आधारे वरचा अंदाज मांडला, हा आकडा वेगळा असू शकतो. वरच्या अनॅलिसिस च्या अनुसार sample साइज १ ने वाढला, तरी अॅक्यूरसी लगेच वाढते असं दिसतं. त्यामुळे किती माहिती वापरली याचा तर्क लावणं कठीण वाटतंय.
Deleteखूप छान..... शैक्षणिक संदर्भ अंकामध्ये अशाच रंजक पद्धतीने माहिती दिलेली असते.... आपण संदर्भ अंकासाठी लेख पाठवू शकता....स्वागतच आहे....
ReplyDeleteअभिप्राय कळवल्याबद्दल आभारी आहे. शैक्षणिक संदर्भ अंकांबद्दल अधिक माहिती देऊ शकाल का?
Deleteमस्त.
ReplyDeleteलेख वाचला आणि लोकांना पुढे पाठवला सुद्धा. तेवढीच त्यांच्या ज्ञानात भर.
लिखते रहो.
धन्यवाद विनायक 🙏
DeleteVery informative!
ReplyDeleteThank you, Sagar!
ReplyDelete