Talen om een Data Science Master te worden
JCU Online Master of Data Science Student
Inhoudsopgave:
Iedereen wil dat er in hun carrière veel vraag is - omdat de vraag zich vertaalt in een groot salaris en geen tekort aan werk. Tegenwoordig bruist de big data-ruimte vol met dat soort werk, aangezien bedrijven van elke omvang informatie moeten verzamelen en analyseren om beslissingen en voorspellingen te doen (en resultaten te krijgen).
Dat is precies wat data scientists doen: informatie ontdekken, verbindingen maken, datavisualisaties maken en bedrijven helpen efficiënt te werken. En een grondig begrip van de juiste programmeertalen is essentieel voor het interpreteren van statistieken en het werken met databases.
Volgens KDnuggets gebruikt 91% van de datawetenschappers de volgende vier talen.
Taal 1: R
R is een op statistieken georiënteerde taal die populair is onder dataminingers. Het is een open-source, object-georiënteerde implementatie van S, en is niet overdreven moeilijk om te leren.
Als je wilt leren hoe je statistische software kunt ontwikkelen, dan is R een goede taal om te weten. Hiermee kunt u ook gegevens manipuleren en grafisch weergeven.
Als onderdeel van hun Data Science Specialization-programma, biedt Coursera een klasse op R die je niet alleen leert hoe je programmeert in de taal, maar ook gaat over hoe je het kunt toepassen in de context van data science / analyse.
Taal 2: SAS
Net als R wordt SAS voornamelijk gebruikt voor statistische analyse. Het is een krachtig hulpmiddel voor het transformeren van de gegevens van databases en spreadsheets naar leesbare formaten (zoals HTML- en PDF-documenten) en de meer visuele tabellen en grafieken.
Oorspronkelijk ontwikkeld door academische onderzoekers, is het uitgegroeid tot een van de meest populaire analytische tools wereldwijd voor bedrijven en organisaties van alle soorten. Het is meer een soort software van grote bedrijven en wordt meestal niet gebruikt door kleinere bedrijven of individuen die alleen werken.
Hulpbronnen voor het leren van SAS worden in dit document vermeld. De taal is niet open-source, dus je zult jezelf waarschijnlijk niet gratis kunnen leren.
Taal 3: Python
Hoewel R en SAS in de analytische wereld het vaakst worden beschouwd als 'de grote twee', is Python onlangs ook een mededinger geworden. Een van de belangrijkste voordelen is de grote verscheidenheid aan bibliotheken (bijvoorbeeld Panda's, NumPy, SciPi, enz.) En statistische functies.
Omdat Python (net als R) een open-source taal is, worden updates er snel aan toegevoegd. (Bij gekochte programma's zoals SAS moet u wachten op de volgende versieversie.)
Een andere factor om te overwegen is dat Python misschien het gemakkelijkst te leren is, vanwege de eenvoud en de brede beschikbaarheid van cursussen en bronnen erop. De LearnPython-website is een geweldige plek om te beginnen.
U kunt ook een vollediger lijst met leermaterialen van Python vinden.
Taal 4: SQL
Tot nu toe hebben we gekeken naar talen die in dezelfde familie zijn en (min of meer) dezelfde functies hebben. SQL, dat staat voor "Structured Query Language," is waar dat verandert. Deze taal heeft niets te maken met statistieken; het richt zich op het verwerken van informatie in relationele databases.
Het is de meest gebruikte databasetaal en is open source, dus aspirant-datawetenschappers mogen dit zeker niet overslaan.
Learning SQL moet u geschikt maken om SQL-databases te maken, de gegevens erin te beheren en relevante functies te gebruiken. Udemy biedt een cursus die alle basisvaardigheden omvat en vrij snel en pijnloos kan worden voltooid.
Conclusie
Minimaal moet u waarschijnlijk SQL leren en ten minste één van de statistiekentalen kiezen. Maar als je de tijd hebt (en in het geval van SAS, geld) en echt wilt werken, dan is er niets dat je niet alle vier kunt leren!
Haast je niet, krijg veel oefening, verbeter je vaardigheden en geniet van de werkzekerheid.
Taken voor vreemde talen
Mensen die tweetalig zijn, hebben verschillende carrièremogelijkheden. Dit zijn de beste banen in vreemde talen. Leer een tweede taal als je er nog geen kent.
Career Spotlight: wat is data science?
Big data en analyses zijn buzzwords. En om een goede reden. Gegevenswetenschap is een van de populairste banen in technologie. Maar wat houdt data science echt in?
Ontslagen worden versus ontslagen worden
Er zijn verschillen tussen ontslagen en ontslagen worden in termen van werknemersrechten en verhaal, en implicaties voor het innen van werkloosheidsuitkeringen.