W 2012 r. HBR nazwał "badacza danych" jako "najseksowniejszą pracę stulecia". Ale co naprawdę wiąże się z nauką o danych? A co ważniejsze, w jaki sposób możesz zdobyć umiejętności potrzebne, by nazwać siebie naukowcem zajmującym się danymi?
Czym jest nauka danych?
Dawniej, naukowcy zajmujący się danymi znajdowali się głównie w przestrzeni akademickiej. Teraz, wraz z rosnącą ilością gromadzonych danych i potrzebą analizy, naukowcy zajmujący się danymi zyskiwali duże zainteresowanie w wielu firmach i branżach, małych i dużych.
Nauka danych jako zawód obejmuje szereg umiejętności w zakresie matematyki, statystyki i programowania komputerowego. Jest to branża zdominowana przez mężczyzn, szacunki kobiet w naukach o danych wynoszą około 10%.
Według Glassdoor średnia krajowa pensja dla naukowców zajmujących się danymi wynosi 113 436 USD. Patrząc tylko na rekompensatę, nauka danych jest o wiele bardziej atrakcyjna niż inne podobne kariery.
Umiejętności potrzebne do bycia Data Scientist
Podobnie jak wszystkie zawody, specyficzne umiejętności wymagane do wypełnienia stanowisk związanych z nauką danych zależą od pojedynczej firmy.
Istnieją jednak pewne zestawy umiejętności / oprogramowania, które pozostają spójne.
- Języki programowania statystycznego, takie jak R i SAS
- Język zapytań baz danych, taki jak SQL
- Podstawowe statystyki, takie jak testy statystyczne, rozkłady, estymatory maksymalnej wiarygodności i tak dalej
- Metody uczenia maszynowego, takie jak k-Najbliżsi sąsiedzi, losowe lasy, metody zespołowe itp.
- Rachunek wieloczynnikowy i algebra liniowa
- Rejestrowanie danych i opracowywanie nowych produktów opartych na danych
- Znajomość platform platformowych Hadoop
- Narzędzia do wizualizacji, takie jak Flare, HighCharts lub AmCharts
Jak zostać naukowcem danych
W dzisiejszych czasach istnieją trzy realistyczne możliwości zostania naukowcem zajmującym się danymi:
- Samokształcenie za pomocą programów takich jak Udacity
- Uczęszczanie na obóz do nauki danych
- Chodzenie do szkoły wyższej na studia magisterskie
Oczywiście każda metoda ma swoje zalety i wady.
Samokształcenie
Zalety:
- Wygodne: można to zrobić we własnym czasie w dowolnym środowisku iw dowolnym tempie
- Przystępne cenowo: może kosztować od 0 do 600 USD.
- Oszczędność czasu: kursy online można ukończyć w ciągu 8-18 miesięcy.
Cons:
- Po ukończeniu otrzymasz certyfikat
- Brak zaangażowania peer-to-peer lub nauczyciela-ucznia
- Brak pomocy przy poszukiwaniu pracy
Data Science Boot Camp
Zalety:
- Małe zaangażowanie czasowe: można ukończyć w ciągu 6 tygodni do 3 miesięcy
- Stosunkowo niedrogie, przynajmniej w porównaniu do uzyskania tytułu magistra (obozy są bezpłatne - 16 000 $)
- Idealny dla osób, które chcą szybko zmienić karierę
- Wiele obozów startowych oferuje pomoc w procesie poszukiwania pracy po zakończeniu
Cons:
- Otrzymuj tylko portfolio projektów - bez "prawdziwego" doświadczenia zawodowego
- Dużo do nauczenia się w krótkim czasie
- Może to być do 40 godzin w tygodniu pracy (w przeciwieństwie do samokształcenia, gdzie możesz jechać we własnym tempie i nadal pracować w niepełnym wymiarze godzin / na pełny etat)
Magister
Zalety:
- Dyplom po zakończeniu
- Ustrukturyzowane uczenie się z profesjonalnie wyszkolonymi instruktorami
- Doświadczenia w świecie rzeczywistym: wiele programów obejmuje staże, które dodadzą doświadczenie i wiedzę
- Duży czas na naukę i absorpcję wszystkich informacji
Cons:
- Drogie: może kosztować od 20 000 do 70 000 USD - nie uwzględniając kosztów utrzymania
- Czasochłonne: może również trwać najdłużej (9-20 miesięcy)