Prabakaran Chandran
3 min readJun 28, 2020

Data science — வானம் காத்திருக்கு....சிறகு விரிப்போம் வாரீர்....

+2 முடித்தவர்கள் , அறிவியல்,தொழில்நுட்பம் மற்றும் பொறியியல் கற்றுக்கொன்றிப்போர்,முடித்தவர்கள், பெற்றோர் ஆசிரியர்களுக்கானது...

உங்களின் சிறகு விரிக்க வண்ணமயணமா வானமாய் அமைய போகும் Data Science,Deep learning, Machine learning , computer vision , Natural language processing ஆகியவற்றை உள்ளடக்கிய artificial intelligence குறித்து விரிவாக எழுதியுள்ளேன்... படியுங்கள்...பரப்புங்கள்...

1. மேலே சொன்னவை எல்லாம் என்ன ?

அ.Data science - இது ஒரு நிறுவனம் சார்ந்த தரவுகளை கொண்டு அந்நிறுவனத்திற்கு ஏற்பட்டுள்ள பிரச்சனைகளுக்கு தீர்வுகாணும் வழிமுறையாகும்/தொழில்நுட்பமாகும்..எடுத்துக்காட்டாக நீங்கள் ஒரு தொழில் அதிபர் உங்களுக்கு நுகர்வோரை எப்படி அடைவது(consumer/customer reach) அவர்களை அடைந்து உங்கள் பொருளையோ அல்லது சேவையோ தந்த பின்பு அவர்களை எப்படி புரிந்து கொள்வது(consumer behaviour), உங்கள் பொருளுக்கான demand, எவ்வளவு விற்பனையாகும்(forecasting), உங்கள் தொழிலை பாதிக்கும் புறக்காரணிகளின் பங்கு என்ன(competitor, Government, economy) உள்காரணிகளின் பங்கு என்ன(price, marketting, supply chain, promotion) என்றெல்லாம் ஆராயலாம், முடிவெடுக்கலாம்,தீர்வுகணலாம்..இது வெறும் கார்பொரேட் தொழில்நுட்பம் அல்ல , இந்த சமூகத்திற்காக ஒன்று.. பொருளாதார வளர்ச்சி, அதன் தேக்கநிலைக்கான காரணங்கள்..மேலும் பிரசாந்த் கிஷோர், சுனில் அகியோரெல்லாம் data மற்றும் அவை சொல்லுவனவற்றையே strategy களாக மாறுகின்றன..இன்னும் நிறைய ஒருக்கின்றன data science ல்.. சரி இதன் ability தெரிந்து விட்டது..இதை எப்படி செய்வது , கற்பது குறித்தும் விரிவாக எழுதியுள்ளேன்... Data scinece இல் மூன்று பிரிவுகள் உள்ளன..

அ.Data engineering - இது அங்காங்கே சிதறி கிடைக்கும் data வை ஒன்று சேர்த்தல், அதை பயன்படுத்தக்கூடிய ஒன்றாக மற்றும் செயல் முறையாகும். எளிதாக சொல்லப்போனால் data collection, and Transformation..
ஆ.Data analytics - இது பெறப்பட்ட data வை பகுப்பாய்வு செய்து, தொழிலில் என்ன நடக்கிறது, அது நடந்தமைக்கான காரணம் என்ன , நடக்காமல் செய்ய என்ன செய்யலாம் என்ற பகுப்பாய்வு மற்றும் வியூகம் வகுத்தல் சார்ந்தது..எடுத்துக்காட்டாக தேர்தல் நடந்து விட்டது, நம்மிடையே தொகுதிவரியான வாக்கு விவரம் உள்ளது இதை வைத்துக்கொண்டு அவர் என் வென்றார், தோற்றார் என்றும் , தொழிலில் லாபம் கிடைத்தமிக்கனா காரணங்கள் அறியலாம்..இதில் statistics ன் பங்கு அளப்பரியது.. survey designing தொடங்கி நமது சந்தேகங்களை டெஸ்ட் செய்வது (hypothesis டெஸ்டிங்) , ஒரு விளம்பரத்தின் திறன், ஊடகத்தின் திறன் என்பதெல்லாம் அறியலாம்.

இ.Data science modeling - முன்னர் சொன்னவையெல்லாம் இறந்த கலாம் மற்றும் நிகழ்காலம் குறித்தானவை..காணலாம் predictive modeling எண்பது எதிர்காலம் குறித்த, இன்னுமென் நிழந்த வற்றை இன்னும் அழமாக புரிந்து கொள்ள பயன் படும் statistics மற்றும் maths சார்ந்த algorithms இவை தொகுப்பாக machine learning எனப்படும் இவற்றில் பல ரகங்கள் உண்டு விதங்கள் உண்டு.ஒவ்வொன்றாக எழுதியுள்ளேன்..

சரி மேற்சொன்ன Data science படிக்க என்ன வாய்ப்புகள் உள்ளது..
1.சில கல்லூரிகள் Bachelors degree ஏ DS specialisation உடன்தருகின்றன.. ஆனால் பரவலாக mastersல் கிடைக்கின்றது.. இவையெல்லாம் விடுத்து இப்பொழுது என்ஜினீயரிங்,அறிவியல் படிக்கும், படித்த எவர் வேண்டுமானாலும் Data scientist ஆகலாம் ... வேலைவாய்ப்புகள் கொட்டி கிடைக்கின்றன..

சரி சுயம்புவாக எப்படி Data scientist ஆவது... கீழ சொல்லப்படுபவை உங்களுக்கு தேவைப்படும்..
1.Maths : calculas, statistics, probability - நுண்கணிதம், புள்ளியியல் , நிகழ்தகவு.
2.Business - ஒவ்வொரு துறைசார்ந்த விடயங்கள் கற்க வேண்டும் உதாரணத்திற்கு நீங்கள் சில்லறை வணிகம் குறித்து கற்ற வேண்டுமெனில் அதில் வணிகம் எவ்வாறு நடக்கிறது, அதில உள்ள கலைச்சொற்கள் என்ன என்றெல்லாம் கற்று தேசிய வேண்டும்.
3.technology _ sql எனும் தரவுதளங்கள் பற்றியும் , python , R போன்ற நிரல் மொழிகள் , tableau , Power bi போன்ற software கள் உள்ளன..
சரி இவற்றை எங்கு கற்பது ...
1.courseara வில் கொட்டிகிடைகின்றன..corona offer வேறு கிடைக்கிறது..
2.udemy, data camp, எல்லாம் உள்ளன.
3.நமக்கென்று youtube மஹனுபாவர்கள் உள்ளனர்..பயன் படுத்திக்கொள்ளுங்கள்..

3ஏ மாதம் உங்களுக்கு தன்னம்பிக்கை பிறக்கும். முதல் மாதம் theoritical கான்செப்ட்களை கற்றுத்தெளியுங்கள்..இரண்டாம் மாதம் programming languages ஐ theory ஓடு சேர்த்து படியுங்கள், பழகுங்கள்..மூன்றாம் மாதம் data set கொண்டு சுயமாக projects செய்து உங்கள் போர்ட்போலியோவை (portfolio ) கட்டமையுங்கள்.... இவையெல்லாம் எங்கோ படித்து விட்டு எழுதவில்லை , எனது தனிப்பட்ட முறையில் experiment மற்றும் அனுபவத்தில் எழுதியுள்ளேன்..

சரி Data science குறித்து கற்று விட்டீர்கள்..அடுத்து செயற்கை நுண்ணறிவு நோக்கி நடை போடுங்கள்.. அதென்ன AI (artificial intelligence) - புரிந்து கொள்ள உதாரணங்கள் ... 1.siri , google assistant களோடு கதைக்கிறோம் , 2.snap chat, face app ல் நம்மையே ஆணாக , பெண்ணாக , கிழவராக , குமரியாக மாற்றி பார்க்கிறோம் , youtube recommendation , google search engiene மற்றும் FB auto tagging எல்லாம் AI செய்யும் வித்தைளுள் சில... ஆளில்லா கார்கள் , ட்ரான்கள் ,உம் கூட...

AI ன் கூறுகள் பார்ப்போம் ...1. machine learning ,2.deep learning , 3.Computer vision , 4.Natural languge processing

1.Machine learning என்பது தான் broader term.. அதன் கீழ் தான் மற்றவை..ML என்பது கடந்த கால தரவினைக்கொண்டு தரவுகளுக்கு இடைப்பட்ட தொடர்புகளை அறிந்துகொண்டு அதை எதிர்காலத்திற்கு பயன் படுத்துதல்..உதாரணமாக கடந்தகால விற்பனை கொண்டு எதிர்கால விற்பனையை கனித்தகள் , இன்சூரன்ஸ் claim களில் fraud கண்டறிதல், தொழில் வளர்ச்சி , வீழ்ச்சி என பலவற்றுக்கு கணிதம் சார்ந்த algorithms ஏய் ML.. தற்சமயம் கிளாசிக்கல் ML ஐ விட Deep learning ஏ பிரபலம்... வித்தியாசம் என்னவெனில் ML ல் பல விதமான algorithm உள்ளன அவை ஒன்றிகொன்று வேறுபட்டவை... ஆனால் deep learning என்பது Artificial neural network ஒன்றை அடிப்படையாக கொண்டது... இவற்றை கற்க stanford , mit போன்ற பல்கலை நிறைய கற்றல் ஏடுகள் , videoக்கள் கொண்டுள்ளன..

கை வலிக்கிறது ... பிடித்திருக்குமென நம்புகிறேன்... படியுங்கள்..பயன்பெறுங்கள்...பரப்புங்கள்...

இன்னொரு கட்டுரையில் ஒளி,ஒலி சார்ந்த AI பற்றி எழுதுகிறேன்...

#dataanalytics #DataScientist #machine learning #artificialintelligence