என் பயணத்தின் பிம்பங்கள்...!: 10/4/09

Friday, October 09, 2009

Sum Songz..!!

Nobody wants to be lonely - Ricky Martin and Christina Aguilera

Why, why, why
Oh ooh ohh

There you are, in a darkened room
And you're all alone, looking out the window
Your heart is cold and lost the will to love
Like a broken arrow
Here I stand in the shadows
In the shadows
Come to come, come to me
Can't you see that

Nobody wants to be lonely
Nobody wants to cry
My body's longing to hold you
So bad it hurts inside
Time is precious and it's slipping away
And I've been waiting for you all of my life (ohh)
Nobody wants to be lonely
So why (why), why don't you let me love you

Why (ooh ohh yeah), why (oh why), why

Ooh ooh, yeah
Can you hear my voice, do you hear my song
It's a seranade, so your heart can find me, ohh
And suddenly you're flying down the stairs
Into my arms, baby, ohh

Before I start going crazy
Going crazy, ohh
Run to me
Run to me
Cause I'm dying...

Nobody wants to be lonely
Nobody wants to cry (I don't wanna cry)
My body's longing to hold you (I'm longing to hold you)
So bad it hurts inside
Time is precious and it's slipping away
And I've been waiting for you all of my life (ohh)
Nobody wants to be lonely
So why

Why, why don't you let me love you
I wanna feel you need me
Feel you need me
Just like the air you're breathing
Breathing, I need you here in my life

Don't walk away, don't walk away
Don't walk alway, don't walk away
No, no, no, no...

Nobody wants to be lonely
Nobody wants to cry...yeah yeah

Nobody wants to be lonely (yeah ohh ooh)
Nobody wants to cry (nobody wants to cry)
My body's longing to hold you (is longing to hold you)
So bad it hurts inside (hurts inside)
Time is precious and it's slipping away
And I've been waiting for you all of my life (ohh)
Nobody wants to be lonely
So why (why), why don't you let me love you
Let me love you...

Nobody wants to be lonely
Nobody wants to cry (nobody wants to cry...)
My body's longing to hold you (I'm longing to hold you)
So bad it hurts inside (so hurt inside)
Time is precious and it's slipping away
And I've been waiting for you all of my life
Nobody wants to be lonely
So why (why), why don't you let me love you

Why (why), let me love you
Why don't you let me love you
Why, love you, let me love you

Why (why)

(Thanks :: http://www.lyrics007.com/Christina%20Aguilera%20Lyrics/Nobody%20Wants%20To%20Be%20Lonely%20Lyrics.html)

Gangsta's Paradise - Coolio

Pretty Boy - M2M

This is not America - David Bowie

விளக்கு வைப்போம் - இளையராஜா

Monday, October 05, 2009

ஒலிதச் சமிக்ஞைப் பகுப்பாய்தல்.

சிங்கைத் தமிழ்ப் பதிவர்கள் 'மணற்கேணி 2009' என்ற தலைப்பில் நடத்திய போட்டியில் மூன்று பிரிவுகளில் கட்டுரைகள் அனுப்பக் கேட்டுக் கொண்டிருந்தார்கள்.

முதல் பிரிவான 'அரசியல்/சமூகத்தில்' குறிப்பிட்ட தலைப்புகளில் எழுதுவதற்கு கைவசம் என்னிடம் கருத்துக்கள் இல்லை. மூன்றாம் பிரிவான 'தமிழ் மொழி/இலக்கியத்தை' இப்போது தான் படித்துக் கொண்டிருப்பதாலும், அதிலும் ஆய்வுக் கட்டுரை அளவில் எழுதுவதற்கு நிறைய தயார் செய்தாக வேண்டும் என்பதாலும் அந்தப்புறமும் எட்டிப் பார்க்கவில்லை. மிஞ்சியது 'தமிழ் அறிவியல்' பிரிவு. இதில் ஒரு தலைப்பாக இருந்த 'தமிழ்க் கலைச்சொற்களைப் பயன்படுத்தி ஓர் அறிவியல் கட்டுரை' எடுத்துக் கொண்டேன்.

அறிவியல் மற்றும் தொழில்நுட்பங்களைத் தமிழில் எழுதுவது சுகமான ஓர் அனுபவம். மாணவ மனநிலைக்கு இறங்கி வந்து மீண்டும் கற்க, கற்றதைச் சொல்ல எழுதுவது ஒரு பிடித்தமான வேலை. இயற்பியல் கட்டுரைகளையும், அறிவியல் புனைகதைகளையும் எழுதுவது அதில் இருக்கும் அறிவியலைப் பிறருக்குக் காட்டி அவர்களது ஆச்சரியத்தில் மகிழ்வதை உத்தேசித்துத் தான்.

இப்போட்டிக்காக 'ஒலிதச் சமிக்ஞைப் பகுப்பாய்தல்' என்ற தலைப்பில் நான் பணியாற்றும் துறையின் அடிப்படைகளைச் சற்று எளிமையாக எழுத முயன்றேன். போட்டி செப்டம்பர் 30ல் நிறைந்து விட்டதால், அக்கட்டுரையை இங்கே பதிக்கிறேன்.

***

ஒலிதச் சமிக்ஞை பகுப்பாய்தல்.
(Audio Signal Processing)

எவற்றை ஒலி எனலாம்? ஒலிக்கப்படும், கேட்கப்படும் எதையும்! பேச்சு, இசை, பாடல், இரைச்சல் மற்றும் இந்த வகையறைகளுக்குள் சிக்காத எந்த சப்தமும் ஒலி என்ற பொது வகையில் அடங்கும். உண்மையில் ஒலி என்ற ஒரு பொருள் இருக்கின்றதா? ஒரு மைசூர்பாகு போல, பேருந்துச் சக்கரம் போல, காலைப் பனித்துளி போல..? இல்லை. ஒலி என்பது பரவிக் கொண்டே இருக்க வேண்டும். எழுப்பப்படாத வரை ஒலி என்பது இல்லை. ஜார்ஜ் பெர்க்லி என்ற ஐரிஷ் தத்துவவாதி சுவாரஸ்யமான கேள்வி ஒன்றை எழுப்பினார். 'கேட்பதற்கு யாருமே இல்லாத காட்டில் ஒரு மரம் விழுந்தால் ஒலி வருமா?' இது தத்துவவியல், இயற்பியல் போன்ற துறைகளில் கொஞ்சம் சிந்தனையைக் கிளறச் செய்தது. அறிவியலோ, ‘விழுகின்ற மரம் காற்றின் துகள்களில் அழுத்தத்தை ஏற்படுத்துகின்றது. அவ்வளவு தான். கேட்பதற்கு ஒரு கருவி (காது!) இருந்தால் தான் அது ஒலியாக உணரப்படும்’ என்கிறது.

காற்றேயில்லாத வெட்டவெளியில் மரம் விழுந்தால்..? கேள்வியே கேட்க வேண்டாம். கேட்க ஆள் இருந்தாலும், இல்லாவிட்டாலும் ஒலி இருக்காது.

ஒலி என்பது உருவாக்கப்படும் இடத்திலிருந்து, ஓர் ஊடகத்தின் துகள்களை அதிரச் செய்து, எல்லா திசைகளிலும் அந்த ஆற்றல் தீரும் வரை பரவுகிறது. அச்சுற்றளவிற்குள் வருபவர்களுக்கு கேட்கிறது. ஒலி பரவ கட்டாயம் ஓர் ஊடகம் தேவை. அது காற்றோ, நீரோ, கம்பியோ! ஊடகம் இல்லையேல், அதிர்வதற்கு அணுக்கள் இல்லை; ஒலியும் இல்லை.

இருவர் இயல்பாகப் பேசும் போது பத்தடி சுற்றளவில் கேட்கும். இன்னும் கொஞ்சம் உரத்துப் பேசினால் இருபதடி வரையில் கேட்கும். அதற்கும் மேல் கேட்க வேண்டும் எனில் இன்னும் உரக்கக் கத்த வேண்டும். என்ன நடக்கின்றது? வெளிப்படும் ஒலியின் ஆற்றல் அதிகரிக்கப்படுவதால், அது பரவும் சுற்றளவு அதிகரிக்கிறது. பலன்? கத்தியவர் கொஞ்சம் ஆற்றலை இழந்து இரும வேண்டியதாகின்றது. இதற்கும் மேல் ஒரு கி.மீ வரை கேட்க வேண்டுமெனில், கத்த முடியுமா? அங்கே இயந்திரங்கள் கை கொடுக்கின்றன.

ஒலிவாங்கி (mic), தன் முன் பேசப்படுவதை மின்னலைகளாக மற்றி, கம்பிகள்/கம்பியில்லா ஊடகம் மூலமாக அனுப்ப, ஒலிப்பெருக்கி (audio amplifier) அதனை நாம் தேர்ந்தெடுக்கும் அளவிற்குப் பெருக்கி, ஒலிபரப்பிக்கு (speaker) அனுப்புகின்றது.

இக்கட்டுரையில் பேச்சு, இரைச்சல், சப்தங்கள் ஆகியன பற்றிச் சொல்லவில்லை. ஒலியின் மற்ற வகைகளான இசை, பாடல் ஆகிய கேட்கக் கூடியவற்றை எப்படி சமிக்ஞைகளாக மற்றுகிறார்கள், அவற்றிலிருந்து மீண்டும் கேட்கக் கூடிய இசை, பாடலைப் பெறுகிறார்கள் என்பதை மட்டும் பார்ப்போம்.

அறிவியலில், வகைப்படுத்த ஒரு முறையைப் பின்பற்றுவார்கள். உடைத்துச் சென்று கொண்டே இருப்பது. ஆழம் வரை சென்ற பின் மேலேறும் போது, எளிய பண்பில் தோன்றுகின்ற வித்தியாசங்களைக் கொண்டு வரிசைப்படுத்துவது. உதரணமாக வேதியியல் தனிம அட்டவணை. சேர்மங்களை உடைத்து தனிமங்கள் ஆக்கினர். தனிமத்தை உடைத்து மூலக்கூறு. மூலக்கூறிலிருந்து அணு. உள்ளே நேர்த் துகள், எதிர்த்துகள், நடுநிலைத் துகள். நேர்த்துகளின் எண்ணிக்கையை வைத்து, தனிமங்களை வரிசைப்படுத்தினார்கள். நாமும் அதேபோல் முயன்று பார்ப்போம்.

ஒரு பாடலை எடுத்துக் கொள்வோம். அதில் உள்ள இசையை மட்டும் பிரிப்போம். அதில் பல இசைக் கருவிகளின் கூட்டணி இருக்கின்றது. ஒவ்வொரு கருவியின் இசைச் சேர்ப்பையும் தனித்தனியாக வகுத்து அலசினால், அத்தனையும் ஒலி அலைகள். மிக ஆதாரமான அலை ஒன்றை எடுத்துக் கொண்டு, அதைக் கொஞ்சம் தீவிரமாய் ஆராய்ந்து, அதன் பண்புகளைப் புரிந்து விட்டுக் கட்டுரையை மேலே தொடரலாம்.

ஓர் எளிய சைன் அலை.

இந்த அலை 'சைன்' அலை (sine wave). மிக எளிமையான ஒன்று. பாம்பு அவசரமாக ஊர்ந்து செல்லும் போது, அதன் உடல் வளைவது கிட்டத்தட்ட இது போலிருக்கும். இது ஒரு வட்டம் தான். ஆனால் ஒரே தளத்தில் சுற்றாமல், முன்னோக்கி நகரும் வட்டம். கீழே உள்ள படத்தைப் பார்த்தால் எளிதில் புரிந்து விடும்.

மொழுக் மொழுக் என்று இருக்கும் சைன் அலையை வர்ணிக்க வேண்டுமெனில் அதன் நான்கு பண்புகள் தெரிந்திருக்க வேண்டும். அவை,

அ. அலைநீளம் (wavelength) :: இரு அடுத்தடுத்த உச்சிகளுக்கு இடையேயான தொலைவு. இதன் அலகு ஆர்ம்ஸ்ட்ராங்.

ஆ. அதிர்வெண் (frequency) :: ஒரு நொடியில் சைன் அலை எத்தனை சுழற்சிகளை (cycles ) முடிக்கின்றது என்பதே அதன் அதிர்வெண். இதன் அலகு ஹெர்ட்ஸ்.

இ. கோணம் (phase) :: துவக்க நேரத்தில் சைன் அலை எந்தக் கோணத்தில் இருக்கின்றதோ, அதுவே அதன் கோணம்.

ஈ. மதிப்பளவு (amplitude) :: சைன் அலையின் வோல்டேஜ் மதிப்பு அதன் மதிப்பளவு எனப்ப்டும். முக்கியமாக வோல்டேஜ் (உச்சி முதல் பாதம் வரை). (voltage peak to peak)

இந்த அதிர்வெண் என்ற சங்கதியைக் கொஞ்சம் உற்றுப் பார்த்துக் கொள்ளுங்கள். மின்னணுவியலில் எந்த அலையைச் சொல்லும் போதும் அதன் அதிர்வெண்ணே அதன் முகம். ரேடியோ மிர்ச்சி அலைவரிசை என்னவென்று சொல்லப்படுகின்றது? 98.3 எஃப்.எம். 98.3 அதிர்வெண்ணைக் கொண்ட அலையின் மேல், நிகழ்ச்சியின் ஒலி அலைகள் ஏற்றப்பட்டு காற்றில் தெளிக்கப்படுகின்றன என்பது அதன் அர்த்தம்.

சைன் அலை ஒரு வட்ட வடிவமே என்பதைச் சொல்லும் படம்.

இந்த அலை ஆரம்ப நேரத்தில் சுழிக் கோணத்தில் துவங்கினால் அது சைன் அலை. அதுவே 90 பாகை கோணத்தில் துவங்கினால் அது கொசைன் அலை (cosine wave).

ஜோசப் ஃபூரியர் (கி.பி.1768 - 1830) என்ற அறிவியலாளர் ஓர் உலோகத் தகட்டில் வெப்பம் எப்படி பரவுகின்றது என்பது பற்றிச் சொன்ன ஒரு சமன்பாடு, இன்று அறிவியலின் பெரும்பாலான நுட்பங்களில் பயன்படுகின்றது.

அது :: ஒரு குறிப்பிட்ட நேர இடைவெளியை எடுத்துக் கொன்டு, திரும்பத் திரும்ப வருகின்ற ஒரு அலை நிகழ்வை, சீரான அதிர்வெண் வரிசையைக் கொண்டிருக்கும் எண்ணற்ற சைன் மற்றும் கொசைன் அலைகள் மற்றும் ஒரு மாறிலி ஆகியவற்றின் கூட்டாகப் பிரிக்கலாம்.

எனவே ஓர் இசையை எடுத்துக் கொண்டால், அதனைத் திரும்பத் திரும்ப வரும் பகுதிகளாக வெட்டினால், அந்த ஒவ்வொரு பகுதியையும் சீரான அதிர்வெண் வரிசை கொண்ட சைன் மற்றும் கொசைன் தொகுப்புகளாகப் பிரிக்கலாம்.

இந்த ஒலி அலைகளை இரு வழிகளில் சேமிக்கலாம். அ. தொடர்ந்த அலை முறை. (analog) ஆ. எண்ம இலக்க முறை. (digital) இன்றைய நிலையில் முந்தைய முறை பெருமளவிற்குப் பயன்பாட்டில் இருந்து நீங்கி விட்டது. உதாரணம் ப்ளாஸ்டிக் தகட்டின் மேல் காந்தப் புலம் மூலம் ஒலி முலாம் பூசிச் சேமித்தல். தற்போது இசைச் சந்தையை எண்ம இலக்க முறையில் சேமிக்கப்பட்ட தட்டுக்களே ஆள்கின்றன. உதாரணம் குறுந்தகடு (compact disc), எண்ம பற்பயன் தகடு (digital versatile disc), நீலக் கதிர்த் தகடு (blue ray disc) என்று சொல்லலாம். இம்முறையின் முக்கிய முன்னேற்றம் நீண்ட வாழ்நாள். ஆண்டுகள் பல ஆனாலும் துல்லியத்தன்மை கெடாமல் இருக்கும். மாறாகத் தொடர்ந்த அலை முறையைப் பயன்படுத்திச் சேமிக்கும் பாடல்கள், தொடர்ச்சியாகப் பயன்படுத்தினால், விரைவில் தேய்மானம் அடைந்து, அழத் தொடங்கி விடுகின்றன.

இப்போது தொடர்ந்த அலை வடிவில் இருக்கும் ஓர் சைன் அலை எவ்வாறு எண்ம இலக்க முறையில் சேமிக்கப்படுகின்றது என்பதைப் பார்ப்போம். பின் அதே முறையில் ஒரு இசைக் கொத்தைச் சேமிப்போம். பிறகு எண்ம இலக்க முறைப்படி மாற்றப்பட்ட பாடலை இறுக்கப்படுத்துவதன் (compression) காரணம், வழிகள் பற்றிக் காண்போம்.

ஒரு சாதாரண சைன் அலையை எடுத்துக் கொள்வோம். அது கீழ்க்காணும் பண்புகள் கொண்டதாக இருக்கட்டும். 10வோ (உ-பா), 1கிஹெ, சுழி பாகை கோணம். வோல்ட்டேஜ்களாகச் சொல்லப்படும் இந்த அலை எவ்வாறு எண்களாக குறிப்பிடப்படுகின்றது?

சைன் அலை.

முதலில் இந்த தொடர்ந்த அலை மாதிரிப்படுத்தப்படும். மாதிரிப்படுத்தல் (sampling) என்பது ஒரு குறிப்பிட்ட இடைவெளியில் அலையின் மதிப்பளவை குறித்துக் கொண்டே வருவது. எப்படி அந்த 'குறிப்பிட்ட இடைவெளியைத்' (time duration) தேர்ந்தெடுப்பது? மாதிரிப்படுத்தப்படும் தொடர்ந்த அலையைப் பொறுத்து அம்மதிப்பு மாறுமா? இதற்கென்று ஏதாவது விதி இருக்கின்றதா?

இருக்கின்றது. அதனை நைக்வெஸ்ட்-ஷானன் மாதிரிப்படுத்தல் வரையறை (Nyquist-Shannon Sampling Theorem) என்பார்கள். அதன்படி ஒரு தொடர்ந்த அலை வடிவில் பல அதிர்வெண்கள் கொண்ட அலைகள் உள்ளன. அதனை மாதிரிப்படுத்துகிறோம். அந்த மாதிரிகளிலிருந்து மீண்டும் அதே தொடர்ந்த அலை வடிவத்தைப் பெற வேண்டுமெனில், மாதிரிப்படுத்தும் போது, ஒரு நொடியில் எடுக்கின்ற மாதிரிகளின் எண்ணிக்கை, அந்த தொடர்ந்த அலை வடிவில் இருக்கும் அதிர்வெண்களில் உச்ச அதிர்வெண்ணைப் போல் இரு மடங்கிற்கும் அதிகமாக இருக்க வேண்டும்.

எளிமையாகச் சொன்னால், ஒரு தொடர்ந்த அலை வடிவத்தில், ஃபூரியர் கூற்றின் படி பல சைன் மற்றும் கொசைன் அலைகள் இருக்கும். அதில் உச்ச அதிர்வெண் 10கிஹெர்ட்ஸ் என்று வைத்துக் கொண்டால், அதை மாதிரிப்படுத்தும் போது, ஒரு நொடிக்கு 20 ஆயிரம் மாதிரிகளுக்கும் அதிகமாக எடுக்க வேண்டும். அப்போது தான் அந்த மாதிரிகளைக் கொண்டு மறு உருவாக்கம் செய்யும் போது, அதே தொடர்ந்த அலை வடிவம் கிடைக்கும். இல்லாவிடில் மாய உருக்குழப்பம் (aliasing) ஏற்படும்.

நமது உதாரணத்திற்குத் திரும்பினால் அங்கே ஒரே ஒரு சைன் அலை தான் இருக்கின்றது. நல்லதாகப் போனது. அதன் அதிர்வெண் 10கிஹெ. எனவே ஒரு நொடிக்கு 20ஆயிரம் மாதிரிகள் எடுக்க வேண்டும். எனில், ஒரு சுழற்சிக்கு இரண்டு மாதிரிகள். இப்போது அடுத்த குழப்பம். அந்த இரண்டு புள்ளிகளை எங்கு குறிப்பது. ஓ, ஓ'-லா, க, கா-லா அல்லது அ, ப-லா?

முன்பே பார்த்திருக்கிறோம். மாதிரிப்படுத்தல் ஒரு குறிப்பிட்ட இடைவெளியில் தான் நடைபெற வேண்டும். இரண்டு புள்ளிகளும் நேர் மதிப்பு பேட்டையிலோ, எதிர் மதிப்பு பேட்டையிலோ வர முடியாது. அப்படி ஒரே பகுதியில் வந்தால், மற்றொரு பகுதி இருப்பது தெரியாமல் போய் விடும். எனவே ஒரு புள்ளி நேர்ப் பகுதியிலும், மற்றொன்று எதிர்ப்பகுதியிலும் தான் வர வேண்டும். ஏன் ஓ,ஓ'ல் வரக் கூடாது? ஓ,ஓ'ல் மாதிரிகள் எடுத்தால் என்ன ஆகும்? அனைத்து மதிப்புகளும் சுழியாக இருக்கும். சைன் அலை, ஓர் அதிர்வெண் அற்ற நேர்க்கோடாக மாறி விடும். சரி, க, கா-வில் எடுக்கலாமா? சுழியும் இல்லை. நேர் மற்றும் எதிரில் இருக்கின்றன. நல்லது. அப்படி எடுத்தால், அலையின் நேர் மற்றும் எதிர் உச்ச மதிப்புகள் தெரியாமல் போய், 3வோ (உ-பா) என்று குறைந்து விடும். எனவே ஒரே வழி: அ, பயில் மாதிரிகள் எடுப்பது தான். ஆனால் இது போதுமா? போதாது. எவ்வளவுக்கெவ்வளவு அதிக மாதிரிகள் எடுக்கின்றோமோ, அ.அளவு அதே உண்மையான தொடர்ந்த அலை வடிவம் மறு உருவாக்கம் செய்ய முடியும்.

இப்போது முழுமையாக எண்மப்படுத்தியாகி விட்டதா? இல்லை. தொடர்ந்த அலை வடிவத்தில் இருந்து மாதிரிகள் எடுத்திருக்கிறோம். ஆனால் அதன் மதிப்புகள் தொடர்ந்த அலை வடிவத்தின் மதிப்புகளிலேயே இருக்கின்றன. சேமிக்கும் வகையில் இன்னும் மாற்றப்படவில்லை. அதற்கு அடுத்த நிலையான, எண் பொருத்திக்குள் (Quantizer) செலுத்த வேண்டும். இந்தச் செயல்முறை உள்ளிடும் அலையைப் பொறுத்து அல்ல. மாறாக எந்த ஊடகத்தில் சேமிக்கின்றோமோ, அதன் திறன்களைப் பொறுத்தது.

உதாரணமாக இந்த இசை மாதிரிகளை ஒரு குறுந்தகட்டில் சேமிக்க விரும்புகிறோம் என்று கொள்வோம். குறுந்தகட்டின் வரையறைப்படி ஒரு மாதிரிக்கு 16 துணுக்குகள் (16 bits) ஒதுக்கீடு செய்யப்படும். 16 துணுக்குகள் என்றால் எல்லை சுழியில் இருந்து இரண்டுன் அடுக்கு 16 (65535) வரை செல்கிறது. பொதுவாக இசை மாதிரிகள் நேர் மற்றும் எதிர் மதிப்பளவுகளைக் கொண்டிருக்கும். +3வோ, - 2.5வோ என்பன போல. குறிப்பிடும் எண் நேர் மதிப்பா , எதிர் மதிப்பா என்று குறிப்பிடுவதற்காக, முதல் துணுக்கு (இடமிருந்து வலமாக!) அனுமதிக்கப்படுகின்றது. அத்துணுக்கு 1 என்றால் அந்த எண் எதிர் மதிப்பு எண்; 0 என்றால் நேர் மதிப்பு எண். இப்போது ஒரு துணுக்கு குறியீட்டைச் சொல்ல ஒதுக்கப்பட்டு விட்டதால், மிச்சம் இருக்கும் 15 துணுக்குகள் மட்டுமே மாதிரியின் மதிப்பைச் சொல்லும். எனவே இப்போது இந்த 16 துணுக்குகள் குறிப்பிடும் மதிப்பு - 32768லிருந்து 32767 வரை அமைகின்றது.

ஓர் இசைத்துண்டின் மதிப்பளவின் எல்லை +10வோ (உ-பா) என்று கொள்வோம்.. அதாவது +5வோ முதல் - 5வோ வரை. இந்த 10வோ (உ-பா) 65535 மதிப்புகளாக வெட்டப்படுகின்றது. - 5வோ - 32768க்கும், +5வோ 32767க்கும் இணை செய்யப்பட்டு, இடைப்பட்ட மதிப்பளவுகள் தகுந்தாற்போல் குறிக்கப்படுகின்றன.

இப்போது ஒவ்வொரு மாதிரியும் என்ன மதிப்பளவில் இருக்கின்றதோ, அதற்குச் சமமான எண்ம மதிப்பு கொடுக்கப்படுகின்றது.

இங்கே ஒரு சிக்கல் வருகின்றது. மாதிரியின் மதிப்பளவிற்குச் சமமான எண்ம மதிப்பு இருந்தால் சுலபமாக அந்த எண்ம மதிப்பு அந்த மாதிரிக்கு அளிக்கப்படும்.அவ்வாறின்றி, இரண்டு வெட்டப்பட்ட மதிப்பளவுகளுக்கு இடையே அந்த மாதிரியின் மதிப்பளவு இருக்குமானால், என்ன செய்வது?

இரு வழிகள் தான் உள்ளன. அந்த மாதிரியின் மதிப்பளவை விட முதல் அதிகமான எண்ம மதிப்பு ஒதுக்கப்பட்ட மதிப்பளவை எடுத்துக் கொள்ள வேண்டும். அல்லது அந்த மாதிரியின் மதிப்பளவை விட முதல் குறைவான எண்ம மதிப்பு ஒதுக்கப்பட்ட மதிப்பளவை எடுத்துக் கொள்ள வேண்டும். பின் அதற்கான எண்ம மதிப்பை அந்த மாதிரிக்கு இணையாக குறித்துக் கொள்ள வேண்டும்.

இந்த முடிவை எடுப்பது நாம் தேர்வு செய்யும் எண் பொருத்தியின் பண்பைப் பொறுத்தது. இப்படி உண்மையான மதிப்பளவிற்கு இல்லாமல், அதற்கு அண்மை மதிப்பளவிற்கு அந்த மாதிரி மாற்றிக் குறித்துக் கொள்வதால், இது ஒரு பிழையாக மாறி விடுகின்றது. இது எண் பொருத்தல் குறை (Quantization Error) எனப்படுகின்றது.

இப்படி மின்னலை வடிவில் இருக்கும் ஒலியலைகள் முதலில் மாதிரிப்படுத்தப்பட்டு, பின் எண்மப்படுத்தப்பட்டு சேமிக்கப்படுகின்றன. மறு உருவாக்கத்தில் மேற்சொன்ன வரிசைக்குத் தலைகீழாகச் செய்முறைகள் மேற்கொள்ளப்பட்டு தொடர்ந்த அலை வடிவிற்கு கொண்டு வரப்படுகின்றன. இந்த அலை வடிவமும், மாதிரிப்படுத்தலுக்கு முன் இருந்த அலை வடிவமும் துல்லியமாக ஒத்திருக்குமா என்றால், இருக்காது. காரணம் எண் பொருத்தல் குறை.

அடிப்படைகள் போதும்.

ஒரு குறுந்தகட்டில் ஒரு பாடல் எப்படி சேமிக்கப்படுகின்றது என்று பார்ப்போம். உதாரணத்திற்கு இப்படிப்பட்ட ஒரு பாடலைக் கொள்வோம். பாடலின் காலம் நான்கு நிமிடங்கள். இரண்டு பாதைகள் (இடது மற்றும் வலது). ஒரு பாதையில் ஒரு நொடிக்கு மாதிரிப்படுத்தப்பட்டு எடுக்கப்பட்ட மாதிரிகள் எண்ணிக்கை 44100. (இது என்ன 44100? பின் பார்ப்போம்.). இப்போது ஒரு சின்ன கணக்கீட்டில் இந்தப் பாடல் மொத்தத்தையும் குறுந்தகட்டில் சேமிக்க எத்தனை துணுக்குகள் தேவைப்படும் என்று பார்ப்போமா?

ஒரு நொடிக்கு ஒரு பாதைக்கு 44100 மாதிரிகள்.
இரு பாதைகளில் ஒரு நொடிக்கு 88200 மாதிரிகள்.

ஒரு மாதிரிக்கு குறுந்தகட்டில் ஒதுக்கப்படும் துணுக்குகள் 16.
88200 மாதிரிகளுக்கு 1411200 துணுக்குகள்.

நான்கு நிமிடங்களுக்கு 240 நொடிகள்.
எனவே மொத்தப் பாடலுக்கு 338688000 துணுக்குகள்.

பைட் அளவில் 42336000 பைட்கள். கிட்டத்தட்ட 42 மெகாபைட்கள்.

ஒரு நான்கு நிமிடப் பாடலுக்கு இத்தனை பெரிய நினைவிடம் தேவையா என்று யோசித்தார்கள். ஏதாவது செய்து குறைக்க முடியுமா என்று பார்த்தார்கள். அந்த ஆய்வுகளின் அடிப்படை, எந்த முறையாவது கண்டுபிடிக்கலாம். அதைப் பயன்படுத்தி ஒரு பாடலை இறுக்கலாம். அப்படி இறுக்கப்பட்ட வஸ்துவில் இருந்து, பாடலை மறு உருவாக்கம் செய்யும் போது பெறப்படும் பாடல் இறுக்கப்படாத பாடலிலிருந்து, ஒரு துணுக்கு கூட, கவனிக்க, ஒரு துணுக்கு கூட மாறுபட்டிருக்க கூடாது.

அதாவது துணுக்குகள் தொலையாமல், மதிப்பு மாறாமல் இருக்க (சுழியிலிருந்து ஒன்று அல்லது ஒன்றிலிருந்து சுழிக்கு) வேண்டும். இந்த நிபந்தனையைப் பூர்த்தி செய்த இறுக்கப்படுத்தல் முறைகள் இழப்பில்லா இறுக்கப்படுத்தல் முறைகள் (lossless compression methods) எனப்படுகின்றன.

எளிமையான ஒரு உதாரணமாக வின்ஸிப்பைச் (Winzip) சொல்லலாம்.

ஆனால், இந்த முறையில் பாடல் இறுக்குதலில் ஓரளவுக்கு மேல் குறுக்க முடியவில்லை. எனவே, அடுத்த முன்னேற்றமாக இழப்புள்ள இறுக்கப்படுத்தல் முறைகள் (lossy compression methods) வரத் துவங்கின.

என்ன, இறுக்கப்படும் போது இழப்பாகுமா? அப்படியெனில் பாடலை மறு உருவாக்கம் செய்யும் போது தகவல் மாறுபட்டிருக்குமா? எனில் இறுக்குவதால் என்ன பலன்..? என்று கேட்கலாம். சொல்லப் போனால் 'இழப்பு இருக்கும்; ஆனால் இருக்காது.'

இருங்கள், விளக்கமாகப் பார்ப்போம். அதற்கு முன் மனித கேட்டல்-உணர்தல் (human psycho acoustics) முறைகளில் இருக்கும் சில மாயாஜாலங்களை சுருக்கமாகப் பார்ப்போம்.

மனித செவிப்புலன் எல்லா அதிர்வெண் அலைகளையும் சமமாகக் 'கேட்பதில்லை'. ஒரு குறிப்பிட்ட பட்டை (band) அதிர்வெண்களுக்கு ஒரு மாதிரியாகவும், வேறு குறிப்பிட்ட பட்டை அதிர்வெண்களுக்கு வேறு மாதிரியாகவும் பதில் புரிகின்றது. கீழ்க்காணும் வரைபடங்கள், ஒரு இயல்பான மனிதனின் செவிப்புலன் வெவ்வேறு அதிர்வெண்கள் கொண்ட அலைகளுக்குத் தரும் பதில்கள்.

அதிர்வெண் மற்றும் ஒலியழுத்த அளவுகளைப் பொறுத்தச் செவி உணர்புலம்

அதிர்வெண் பொறுத்து அலைகளைப் பிரித்தறியும் எல்லைகள்

மனிதனால் கேட்கக்கூடிய அதிகபட்ச அதிர்வெண் 20000 ஹெர்ட்ஸ் என்பதை அறிவோம். எனவே தான் முதல் எண்ம சேமிப்பு ஊடகமான குறுந்தகட்டில் பாடலைச் சேமிக்கும் போது ஒரு நொடிக்கு ஒரு பாதைக்கு 44100 மாதிரிகள் (நைக்வெஸ்ட்-ஷானன் மாதிரிப்படுத்தல் வரையறை) என்று வைத்துக் கொண்டார்கள்.

மேற்காணும் இரு படங்கள் மனிதச் செவியின் இரு முக்கியமான பண்புகளைச் சொல்கின்றன.

முதலாம் படம் அதிர்வெண் மற்றும் ஒலியழுத்த அளவுகளைப் பொறுத்தச் செவி உணர்புலம் (pure tone frequency response of human ear). எளிமையாகப் புரிந்து கொள்ள, ஒரே நேரத்தில் 3கிஹெ மற்றும் 100ஹெ அதிர்வெண்கள் கொண்ட அலைகளை எழுப்பி, இரண்டையும் மனிதச் செவி கேட்க வேண்டுமெனில், 100ஹெ அதிர்வெண் கொண்ட அலையின் மதிப்பு 3கிஹெ அதிர்வெண் கொண்ட அலையின் மதிப்பளவை விட எட்டு மடங்கு அதிகமாக இருக்க வேண்டும். 12 ஹெ முதல் 20கிஹெ வரை உள்ள மனிதனால் கேட்கக் கூடிய எல்லைக்குள் 3கிஹெர்ட்ஸுக்குத் தான் மனிதச் செவி அதிக உணர்புலன் கொண்டது.

இரண்டாம் படம் அதிர்வெண் பொறுத்து அலைகளைப் பிரித்தறியும் எல்லைகள் (auditory filters of human ear). குறைந்த அதிர்வெண் பிரதேசங்களில் இரு வெவ்வேறு அலைகள் நெருக்கமான அதிர்வெண்கள் கொண்டிருந்தாலும் நம்மால பிரித்துப் புரிந்து கொள்ள முடியும். ஆனால் உயர் அதிர்வெண் பகுதியில் அந்த பிரித்தறிதல் எல்லைகள் விரிகின்றன. அதாவது 10ஹெ, 12ஹெ வந்தால் பிரித்துக் கேட்க முடியும். ஆனால் 1000ஹெ, 1002ஹெகளுக்கு நம்மால் வித்தியாசம் காண முடியாது.

வெவ்வேறு அதிர்வெண்களைப் பொறுத்து, செவிப்புலனின் சமச்சீரற்ற எதிர்வினைகள் தாம், இழப்புள்ள இறுக்கப்படுத்தல் முறைகளுக்கு ஆதாரம்.

ஒரு குறிப்பிட்ட நேரத்தில் ஓர் இசைக் கோர்வையில் சில அலைகள் உள்ளன என்போம். அவை ஒரு குறிப்பிட்ட அதிர்வெண் பட்டையில் இருக்கின்றன. அவற்றுள் ஓர் அலை அதிக மதிப்பளவு பெற்றிருக்கின்றது . முதலாம் படத்தின் படி, அந்த அலை அதன் அருகாமை அலைகளை அமுக்கி (எத்தனை அ..!) விடும். அதாவது அந்த அலை மற்ற அலைகளை நாம் 'உணர்வதிலிருந்து' மறைத்து விடும் (Masking). அப்படியெனில் அந்த மற்ற அலைகளைச் சேமிப்பது அனாவசியம் அல்லவா! அந்த அலைகள் இருந்தாலும் நாம் அவற்றைக் கேட்கப் போவதில்லை. பின் அவை ஏன் இருக்க வேண்டும்? அவற்றை வெளியேற்றி விட்டால், அந்தப் பாடல் 'உண்மையான' பாடலாக இருக்காது. ஆனால் கேட்பதற்கு 'உண்மையான' பாடலைப் போலவே இருக்கும்.

எனவே இந்த முறையில் சேமிக்கும் போது தகவல் அடிப்படையில் இழப்பு ஏற்படுகின்றது. ஆனால் கேட்டு உணர்வதன் அடிப்படையில் இழப்பு எதுவும் இல்லை. இது போன்ற முறைகளில் எண்மப்படுத்தப்பட்ட பாடலைச் சேமிக்கும் போது, பாடல் சில அதிர்வெண் அலைகளை இழந்து, இறுக்கப்படுவது, கேட்டு உணர்வதில் எந்த இழப்பையும் ஏற்படுத்தவில்லையெனில், அந்த இறுக்கப்படும் முறைகள் 'கேட்புணர்வின் அடிப்படையில் இழப்பில்லா இறுக்கப்படுதல்' (perceptually lossless compression) எனப்படும்.

இந்த முறையில் பாடலைச் சேமிக்க இழப்பில்லா இறுக்கப்படுத்துதலை விட குறைவான நினைவகமே போதும் என்றாகின்றது. மேலும் பாடலை ஒரு முனையிலிருந்து கம்பி/கம்பியில்லா ஊடகங்கள் வழியாக அனுப்பும் போது குறைவான துணுக்குகளே தேவைப்படும்.

இவ்வாறு கேட்புணர்வின் அடிப்படையிலான இழப்பில்லா இறுக்கப்படுத்தல் முறையில் பாடலை, சட்டம் சட்டமாக (frame) அமைத்து, இறுக்கி, ஒவ்வொரு சட்டத்திற்கும் துணைத் தகவல்களைத் தனியாகக் கோர்த்து, வரிசையாக அடுக்கி, மொத்தத்திற்கும் ஒரு பெயர் வைத்து, பொட்டலம் கட்டி, அனுப்பி, பெறப்பட்ட முனையில் பொட்டலத்தைப் பிரித்து, இறுக்கப்பட்ட விதங்களைத் துணைத் தகவல்கள் மூலம் அறிந்து, அனுப்பிய முனையில் பயன்படுத்திய அதே கருவிகளை வைத்துக் கொண்டு, சட்டம் சட்டமாக உடைத்து, இறுக்கப்பட்ட வரிசைக்குத் தலைகீழாக அவிழ்த்து, இறுதியான எண்ம இலக்கங்களைப் பெற்று, மாற்றியின் (dequantization) மூலமாக தொடர்ந்த அலை வடிவத்திற்கு மாற்றி, மின்னலைகளைக் கொண்டு காந்தப்புலம் உருவாக்கி அதனால் காற்றின் துகள்களை அதிரச் செய்தால், ஒலிபரப்பியிலிருந்து பாடல் அலைகளாய்ச் சிதறுகின்றது.

உத்தமமான உதாரணமாக நன்கு தெரிந்த ஒன்றைச் சொல்லலாம்.

எம்பி3.(MP3)

***