what-is-bit-and-byte-explained-in-hindi


What is Bit and Byte, KB, MB, GB, TB, PB...?

Difference between Bit and Byte.

What is BCD, EBCDIC, ASCII and UNICODE?

यदि आप Computer, Laptop, Mobile या कोई भी Computing Device का यूज करते हैं तो आपने कभी न कभी Bit, Byte, KB, MB, GB, TB, PB इत्यादि का नाम जरूर सुना होगा।

क्योंकि जब भी कभी किसी Computing Device में Storage की बात आती है तो ये सारी चीजें आपके सामने जरूर आयेंगी। 

तो यदि आप इन चीजों के बारे में जानते हैं तो बहुत अच्छी बात है लेकिन नहीं जानते हैं तो आज हम इन सभी चीजों के बारे में विस्तार से जानेंगे। इसलिए बने रहिये इस पोस्ट के साथ। 

ये पोस्ट थोड़ी लम्बी होगी क्योंकि इस पोस्ट में हम उन चीजों के बारे में भी बात करेंगे जो इससे रिलेट करते हैं। तो मैं चाहूंगा कि आप इस पोस्ट को लास्ट तक जरूर देखें। 

तो चलिए शुरू करते हैं-

What is Bit and Byte? Bit और Byte क्या होता है?

सबसे पहले जानते हैं कि Bit क्या होता है?

Bit का Full Form Binary Digit होता है। Bit किसी भी Computing Device की सबसे छोटी इकाई होती है। जिसकी मदद से हम Data Transfer Speed को मापते हैं।

जैसे हम अपने Daily Life में चीजों को मापने के लिए Kilo Gram, Kilo Meter, Liter इत्यादि का यूज करते हैं। उसी प्रकार Computer में हम Bit का यूज करते हैं। 

Bit (Binary Digit) में कुल 2 Value होती है पहला 0 और दूसरा 1। इसके अलावा इसकी तीसरी कोई वैल्यू नहीं होती है। 

Binary Digit में एक समय में एक ही वैल्यू को स्टोर किया जा सकता है या तो 0 या तो 1 दोनों एक साथ नहीं।

अब आपके मन में प्रश्न उठ रहा होगा कि ये 0 और 1 आया कहां से और 0, 1 ही क्यों? 

तो चलिए इसका जवाब जान लेते हैं। तो जैसा कि आपको पता होगा कि हमारा Computer Electricity से चलता है। Electricity मतलब बिजली, करेन्ट, पावर। 

तो आपको ये भी पता होगा कि Electricity की केवल 2 ही States होती हैं पहला On और दूसरा Off यानि चालू और बन्द। इसके अलावा इसकी तीसरा कोई स्टेट नहीं होती है। 

ठीक इसी Concept पर हमारा Microprocessor भी वर्क करता है। क्योंकि Microprocessor में ढ़ेर सारे Transistors का यूज किया जाता है जो कि एक Processor में एक Switch की तरह काम करते हैं यानि ON, OFF का। 

तो जब Processor के Transistor में Electricity नहीं होती है यानि वो Off होता है तो उसकी Value को 0 माना जाता है। और जब Transistor में Electricity होती है यानि वो On होता है तो उसकी Value को 1 माना जाता है। तो इस प्रकार 0 और 1 का Concept सामने आया। 

और इस 0 और 1 के Concept को Binary Language का नाम दिया गया। Binary Language ही एक मात्र ऐसी Language है जिसे हमारा Computer समझता है। Binary Language को Machine Language भी कहा जाता है।

नोट- 0, और 1 को On-Off के अलावा True-False, Flip-Flop, High-Low इत्यादि भी कहा जाता है।

तो आपको समझ आ गया होगा कि Bit क्या होता है और ये कहां से आया। 

प्रश्न- यदि आज के समय में किसी से पूछ लिया जाय कि Computer की भाषा क्या है? या Computer कौन सी भाषा समझता है? तो शायद अधिकतर लोगों का यही जवाब होगा 'English'। मोस्टली लोगों का यही जवाब होगा। जो कि बिल्कुल गलत है।

वास्तविकता तो ये है कि आपके Computer को न तो हिन्दी आती है और न ही अंग्रेजी। न ही चाइनीज आती है और न ही जापनीज। यानि दुनिया में जितनी भी भाषायें है उनमें से उसे एक भी नहीं आता। उसे तो बस एक ही भाषा समझ में आती है जो कि है उसकी अपनी मातृभाषा Binary।

अब आप सोच रहे होंगे कि ये Computer जो हमारे जीवन का अहम हिस्सा बन गया है, जो हमारे इतने सारे काम चुटकियों में कर देता है। जिसकी वजह से हमारी जिन्दगी इतनी आसान हो पायी है उसे कुछ नहीं आता है सिवाय Binary के। लेकिन वास्तविकता यही है।

दरअसल, हम अपने Computer में जो भी कुछ करते हैं Photo देखते हैं, Video देखते है, कोई Document Type करते हैं, गाने सुनते हैं या इसके अलावा कुछ करते हैं वो सब हमें हमारा Computer हमें Binary Language यानि 0,1 के फार्म में बना कर दिखाता है।

अब मुझे लगता है कि आपको Bit के बारे में अच्छे से समझ आ गया होगा।

Nibble - Bit और Byte के बीच एक चीज और आती है जिसे Nibble कहा जाता है। 1 Nibble 4 Bits का Collection होता है। यानि 4 Bit बराबर 1 Nibble। Nibble का यूज सबसे ज्यादा BCD Coding के लिए किया गया था। इसके बारे में हम अभी आगे जानेंगे। Nibble का यूज इसके अलावा और कहीं नहीं किया गया। इसलिए ये उतना पापुलर नहीं हुआ।

अब बात करते हैं Byte की-

What is Byte? Byte क्या होता है?

जिस प्रकार Bit Data की सबसे छोटी इकाई होती है। उसी प्रकार Byte Data की सबसे बड़ी इकाई होती है। जिसका Use हम Data के Size को मापने के लिए करते हैं।

1 Byte कुल 8 Bit से मिलकर बनता है। यानि एक Bit और Byte के बीच 8 अंको का अन्तर होता है। और मौजूदा समय में इसका ही यूज सबसे ज्यादा किया जा रहा है।

अब एक प्रश्न जो आपके मन में उठ रहा होगा कि 1 Byte में 8 Bit ही क्यों? 3, 5 या 9 क्यों नहीं?

इस प्रश्न का उत्तर थोड़ा लम्बा है। जिसे आपको पूरा देखना चाहिए। 

तो जैसा कि आपको बताया जा चुका है कि Computer केवल Binary Number को ही समझता है वह हम Decimal Number को समझते हैं। Decimal मतलब 1, 2, 3, 4, 5 इत्यादि। 

तो ऐसे में हमारे और Computer के बीच ताल-मेल कैसे बैठे। कैसे हम एक-दूसरे की भाषा को समझें। 

इसके लिए IBM द्वारा एक Coding प्रणाली को बनाया गया जिसका नाम BCD रखा गया। 

BCD यानि Binary Coded Decimal । BCD को 8421 के नाम से भी जाना जाता है। 

BCD Coding में Decimal से Binary Convert करने के लिए एक Rule बनाया गया जो कि था कि कम से कम 4 Bits के Pattern से ही आप किसी Decimal Number को Binary में Convert कर सकते हैं। इससे कम होने पर Conversion नहीं हो पायेगा।

BCD Coding में केवल Decimal Number की ही Coding की जा सकती थी। इसलिए इसमें 0 से 9 तक के ही Decimal Character को Encode किया गया। हालांकि इसमें कुल 16 Character तक की ही Coding थी। लेकिन 0-9 के बाद वाले यूज में नहीं आ सकते थे। क्यों?

दरअसल, इसके लिए इसका रूल ही खुद जिम्मेदार है। क्योंकि रूल था कि 4 Bit के Pattern से ही Binary बनायी जा सकती है। तो 0-9 में Single Digit था। 

लेकिन 10-15 तक के सभी अंक डबल में थे। तो ऐसे में हमें दोनों Digit की Coding अलग-अलग करनी पड़ती। और इस प्रकार 4 Bit x 4 Bit = 8 Bit हो जाते। जो कि रूल के बिल्कुल Against था। 

इसलिए 0-9 के बाद बाकी बचे 6 Digit को यूज नहीं किया जाता था बल्कि उन्हें Invalid माना जाता था।

अब 16 Digit कैसे, किस हिसाब?

तो जैसा कि आपको बताया गया कि 1 Bit में 2 ही Value होता है और हमें करना ये होता है कि हर Bit के Value के साथ 2 का गुणा करते चले जाना।

तो जैसे-1 Bit में 2 Value तो 2 Bit में 2 x 2 = 4 Value। 4x2= 8 Value, 8 x 2 = 16 Value। तो हो गया न 4 Bit = 16।

अब BCD में इससे ज्यादा और कुछ नहीं किया जा सकता था।

अब बात करते हैं कि BCD Code के आ जाने से हमें क्या फायदा हुआ? 

BCD Code के आने से हमें ये फायदा हुआ कि जो भाषा पहले हम एक दूसरे को नहीं समझा पाते थे वो समस्या अब दूर हो चुकी थी। 

दरअसल, ये चीजें ऐसे होती थी कि जब आप अपने Computer को कोई Instruction देते थे तो वो पहले Processor में जाता था फिर Processor उसे Binary में Convert करता था और फिर समझता था कि Exactly आप चाहते क्या हैं। या हमें किस चीज को दिखाने का कमाण्ड दिया गया है। इसको समझने के बाद आपका Processor उस Output को Decimal में फिर से Convert करता था और Monitor पर हमें दिखा देता था। और यही प्रक्रिया चलती रहती थी। और यहीं से 4 Bits Coding का आरम्भ हुआ।

इसके बाद भी बहुत सारी Coding प्रणाली आई जैसे-Boudot, Braille, ITA-1, Morse इत्यादि। 

Baudot में 5 Bits Pattern का यूज किया जाता था वहीं Braille में 6 Bits Pattern का यूज किया जाता था। इनके अलावा भी कुछ कोड ऐसे थे जो BCD से पहले आये थे जिन्हें बाद में Implement करके यूज किया जाता रहा। 

अब चुंकि ये सब चीजें शुरूआती दौर के Computer के लिए था और Widely इनका उतना यूज भी नहीं था। इसलिए समय के साथ-साथ ये पुराने और आउटडेडेट होने लगे। 

लेकिन हमें इन सब चीजों को Next Level तक ले जाना था। इसलिए जब Next Level के Computer आये तो उसमें BCD Code का यूज नहीं किया गया। कारण BCD केवल Decimal को ही सपोर्ट कर सकता था। लेकिन हमें इससे आगे की भी जरूरत थी यानि Decimal के साथ-साथ Alphabets और Symbols इत्यादि। 

इसलिए ASCII Coding को लाया गया। ASCII का Full Form - American Standard Code for Information Information Interchange होता है।

इस ASCII Coding को लाने की कहानी बड़ी रोचक रही है। 

दरअसल, शुरूआती दौर से लेकर ASCII के आने से पहले तक तरह-तरह के Coding का यूज किया जाता था। चुंकि Coding वगैरह की खोज में कई देशों का सहयोग रहा था। इसलिए हर देश अपने Computer में खुद की बनाई गयी Coding का युज करता था।

जैसे- America अपनी Coding का यूज करता था, Russia अपनी Coding का यूज करता था, China अपनी Coding का यूज करता था। भारत अपनी Coding का यूज करता था। 

इस प्रकार हर देश अपने द्वारा बनाये गये Coding का ही यूज करते थे। किसी देश को कोई दिक्कत परेशानी नहीं थी। 

लेकिन परेशानी तब शुरू हुई जब एक Country का Data दूसरी Country में जाने लगा। अब चुंकि हर Country ने अपने-अपने Coding अपने हिसाब से तैयार किये थे इसलिए जरूरी थोड़ी था कि सभी की Coding एक जैसी ही हो।

तो ऐसे में होता ये था कि दूसरी Country का डाटा दुसरी Country में Open ही नहीं होता था और हो भी जाता था तो उसका मिनिंग ही बदल जाता था। यानि कम्प्यूटर डाटा इनके यहां के कोडिंग के हिसाब से दिखाने लगता था। तो ऐसे में अर्थ का अनर्थ हो जाता था।

इसलिए इस समस्या को गंभीरता से लेते हुए एक मिटिंग फिक्स की गई और उस मिटिंग में उन तमाम देशो को बुलाया गया जिनके पास उनकी खुद की Coding थी। 

इस मिटिंग में ये तय किया गया कि जिसकी भी Coding प्रणाली हमें सबसे बेहतर लगेगी उसका चुनाव कर लिया जाएगा और उसे ही Official Approved भी किया जायेगा। और उसके बाद सभी देश उसी Coding प्रणाली का यूज करेंगे।

सभी ने अपनी-अपनी Coding प्रणाली बारी-बारी दिखाई और समझाई लेकिन अन्त में America के Coding प्रणाली को ही सबसे बेहतर माना गया और उसे ही Approved कर ये घोषणा की गई कि अब से सभी देश इसी Coding  प्रणाली का यूज करेंगे।

ASCII में Character बनाने के लिए 7 एवं 8 दोनों प्रकार के बिट का यूज किया गया।

ASCII - 7 

ये एक 7 Bit Based Coding प्रणाली है। जिसमें कुल 127 Characters तक की Coding की गई है। जिसमें 0-9 तक के Decimal अंक, Capital Aसे Z तक के Letter , Small A से Z तक के Letter एवं कुछ Symbols हैं।

ASCII - 8

ये एक 8 Bit Based Coding प्रणाली है जिसमें कुल 128-255 Characters की Coding की गई है जिसमें सभी Special Types के Symbols हैं।

ASCII Coding प्रणाली आ जाने के बाद पहले वाली परेशानियां दूर हो गई थी। क्योंकि ये Widely यूज होने लगा था।

EBCDIC Coding 

ये भी एक Coding प्रणाली थी जिसे IBM द्वारा ASCII प्रणाली के आने के बाद लाया गया था। ये प्रणाली भी सेम ASCII की तरह ही थी। इसमें भी 0-255 Characters की Coding की गई थी और सभी Characters सेम ASCII वाले ही थे। लेकिन इसमें सभी Characters 8 Bit Based थे। इस प्रणाली का यूज IBM अपने Main Frame Computers में करता था।

अभी तक तो सभी चीजें ठीक-ठाक चल रही थी। लेकिन बदलाव के इस दौर में ASCII Coding प्रणाली भी हमें कहीं न कहीं बहुत कम लगने लगी। क्योंकि ये प्रणाली केवल अंगेजी तक ही सीमित था। और जो केवल 0-255 Characters को ही सपोर्ट करता था। 

लेकिन अब हमें इससे भी आगे जाना था और ऐसी Coding प्रणाली तैयार करनी थी जो कि न केवल अंगेजी बल्कि दुसरी अन्य भाषाओं को भी सपोर्ट करें। 

जैसे- Hindi, Marathi, Gujrati, Chinese, Russian, French, German, Italian इत्यादि। यानि अंग्रेजी के साथ-साथ दूसरी अन्य सभी भाषाएं।

इसलिए एक नये प्रकार के कोडिंग प्रणाली को तैयार किया गया जिसका नाम UNICODE - Universal Code रखा गया।

Unicode - एक ऐसी कोडिंग प्रणाली है जो आज के समय में लगभग सभी भाषाओं को सपोर्ट करती है।

Unicode प्रणाली हर प्रकार के भाषा कैरेक्टर के लिए एक अगल अंक कोड प्रदान करती है।

Unicode में कुल तीन प्रकार हैं 

1 - UTF - 8

2 - UTF - 16

3 - UTF - 32

UTF (Unicode Transformation Format )

UTF - 8

ये 8 Bit Based प्रणाली है जिसमें कुल 255 Characters को Encode करता है सब कुछ सेम वैसा ही जैसा कि ASCII कोडिंग प्रणाली में था।

UTF - 16

ये 16 Bits Based प्रणाली है जो कुल 65536 Characters को Encode करता है। पहले ऐसा सोचा गया था कि 16 Bits के इस प्रणाली में दुनिया के सभी Characters Encode हो जायेंगे लेकिन बाद में पता चला कि ऐसा नहीं हो सकता। क्योंकि कुछ Characters और Symbols ऐसे भी थे जो इसमें Encode नहीं किये जा सकते थे इसलिए इसके आगे के बारे में सोचा गया।

UTF - 32 

ये 32 Bit Based प्रणाली है जो कुल 4294967296 तक के Characters को Encode कर सकता है। अभी दुनिया में कोई ऐसा Character या Symbols नहीं बचा है जो इसमें सम्मिलित न किया गया हो। सबके सब इसमें आ चुके है। कोई बाकी नहीं रह गया है।

UTF - 32 अभी तक की सबसे बड़ी Encoding Technology है। जो हर प्रकार के भाषा को Convert करने में काफी कारगर है। और आज इसका यूज Widely किया जा रहा है।

तो मेरे हिसाब से आपको इस प्रश्न का उत्तर मिल गया होगा कि 1 Byte में 8 Bit क्यों होते हैं 3 या 9 क्यों नहीं।

चलिए आगे चलते हैं-

तो शुरूआत में ही मैंने Kilo Gram, Kilo Meter, Liter का इत्यादि का उदाहरण दिया था। और मैंने ये भी कहा था कि इसी तरीके के Units का यूज Computer में भी होता है।

कैसे, चलिए जानते हैं-

जैसा कि आपको पता होगा कि एक लीमिट के बाद हमारे Daily Use में आने वाले Kilo, Meter Liter इत्यादि के Unit  बदल जाते हैं। 

जैसे- Gram Kilo Gram में बदल जाता है। Meter, Kilo Meter में बदल जाता है इत्यादि।

तो उदाहरण के तौर पर हम यहां पर Kilo Gram को ले लेते हैं। तो मान लीजिए की आपको 100 Gram चीनी लेनी है वैसे तो कोई 100 Gram लेता नहीं है लेकिन फिर भी मान लेते हैं कि आपको 100 Gram ही लेनी है तो आप दुकानदार से क्या कहेंगे कि 100 Gram चीनी दो, वो आपको दे देगा। लेकिन अब आपको 500 Gram लेनी है तो अब आप 500 Gram कहेंगे और आपको वो दे देगा। 

लेकिन... अब मान लेते है कि आपको 1000 Gram चीनी लेनी है तो अब आप क्या कहेंगे कि भाई 1 हजार ग्राम चीनी देना, कहेंगे नहीं ना। बल्कि अब आप कहेंगे कि भाई 1 किलो चीनी देना। क्योंकि हजार ग्राम पर यूनिट बदल जाती है। और उसी प्रकार आगे जाकर 100 किलो Quintal में बदल जाता है। और इसी प्रकार चलता रहता है। 

ठीक इसी प्रकार Computer के Data Units भी बदलते रहते हैं। इसीलिए तो ढ़ेर सारे Units बनाये गये हैं। जैसे-KB, MB, GB, TB इत्यादि।

तो चलिए देखते है कि Computer में ये Units कैसे बदलते हैं।

जैसा कि आपको पता है कि Computer Data की सबसे छोटी इकाई Bit होती है और 8 Bit मिलाकर 1 Byte बनता है। 

जिस प्रकार 1000 Gram पर वहां Unit बदल जा रही थी। उसी प्रकार यहां पर 1024 होने पर Data Unit बदलते हैं।

जैसे-

1024 Byte                 =             1 Kilo Byte (KB)

1024 Kilo Byte         =            1 Mega Byte (MB)

1024 Mega Byte       =            1 Giga Byte (GB)

1024 Giga Byte         =           1 Tera Byte (TB)

1024 Tera Byte         =           1 Peta Byte (PB)

1024 Peta Byte          =          1 Exa Byte (EB)

1024 Exa Byte           =          1 Zetta Byte (ZB)

1024 Zetta Byte         =         1 Yotta Byte (YB)

Yotta Byte से आगे अभी तो कुछ है नहीं लेकिन हो सकता है कि आने वाले भविष्य में हो जाये। लेकिन Yetta Byte कोई छोटा-मोटा Storage नहीं है। ये अभी तक ये सबसे बड़ा Storage है। और इतने बड़े Storage की फिलहाल हमें कई सालों तक कोई जरूरत नहीं पड़ने वाली है। 

हां बड़े-बड़े Servers इत्यादि में इसका यूज हो सकता है लेकिन एक नार्मल यूजर को तो आने वाले कई सालों तक इसकी जरूरत नहीं पड़ने वाली है।

ध्यान दें-

आज के समय में Bit और Byte को लेकर लोग अक्सर Confuse हो जाते है। खासकर के Internet के मामले में ये पेंच अक्सर फंस ही जाता है। 

दरअसल, जब भी कोई Internet प्लान लेता है तो वो उस समय Provider की बातों पर ध्यान नहीं देता है और बाद में परेशान होता है। 

जैसे-यदि किसी ने 100 MB/s का प्लान लिया तो यहां पर लोग इस बात पर ध्यान नहीं देते है कि Provider Megabyte की नहीं Megabit की बात कर रहा होता है। 

यानि 100 Mega Bits पर सेकेण्ड होता है। लेकिन हमारा Computer सभी चीजों को Byte में मापता है। इसलिए वहां पर फर्क पड़ जाता है। और लोग परेशान हो जाते है। 

Bit और Byte के बीच का अन्तर समझे और उसके लिखने के तरीके पर ध्यान दें। आप कभी भी परेशान नहीं होंगे।

KB                Kb

MB               Mb

GB                Gb

आपने ध्यान दिया कि पहले तरफ का B सभी में Capital है वहीं दूसरी तरफ का b सभी में Small है। 

तो जो Capital वाला B है वो Byte को दर्शाता है और वहीं छोटा b बिट को दर्शाता है। 

उम्मीद करता हूं कि मेरे द्वारा दी गई ये सभी जानकारियां आपके कुछ काम आयी होंगी। और इससे रिलेटेड सभी Confusion भी दूर हो गये होंगे। लेकिन फिर भी यदि कोई प्रश्न है तो नीचे कमेण्ट करिये।

मिलता हूं आपसे एक नये पोस्ट के साथ तब तक के लिए गुड बाय।


Post a Comment

Please do not enter any type of spam or link in the comment box

Previous Post Next Post