Dlaczego trudno dostać pierwszą pracę w data science?

Interesujesz się pracą w branży data science i zastanawiasz się, czy trudno ją dostać? Jeśli masz za sobą pierwsze próby zdobycia pracy, to najprawdopodobniej już wiesz, że jest ciężko. A jeśli dopiero interesujesz się tym tematem i zamierzasz aplikować, to przyjmij do wiadomości: jest ciężko. W tym artykule wyjaśnię, dlaczego tak to wygląda, co być może pomoże Ci w planowaniu kariery w tym obszarze.

Dlaczego jest ciężko?

Odpowiedź na to pytanie można sformułować bardzo prosto: ogromne zainteresowanie tą dziedziną w ostatnich latach spowodowało, że liczba chętnych do pracy w data science jest ogromna. Ponad 100 kandydatów na jedno miejsce to standardowa sytuacja, a na pozycje juniorskie zgłoszeń bywają setki… W niniejszym artykule przyjrzymy się tej kwestii bardziej szczegółowo, rozbijając ją na czynniki pierwsze. Poniżej przedstawimy główne wyzwania w szukaniu pierwszej pracy jako data scientist, które wynikają z dużej liczby kandydatów.

1. Wymagane doświadczenie

    To prawdopodobnie największa bariera dla osób rozpoczynających karierę w data science: żeby dostać pracę na poziomie juniorskim (czyli teoretycznie początkującym), bardzo często trzeba… mieć doświadczenie. Brzmi absurdalnie? Może, ale tak wygląda dzisiejszy rynek pracy.

    Jest to sytuacja, w której wydawałoby się, że wymaganie zaprzecza nazwie stanowiska, ale język ewoluuje i dziś „junior” w data science nie oznacza tylko kogoś bez doświadczenia. Pracodawcy zaliczają do tej grupy także – a właściwie należałoby powiedzieć „zazwyczaj” – osoby z pewnym doświadczeniem, które jednak nie mają jeszcze wystarczających kompetencji, by pracować w pełni samodzielnie.

    Dlaczego pracodawcy szukają osób z doświadczeniem na stanowiska juniorskie? Można by rzec: bo mogą. Jeśli mają do wyboru wielu kandydatów o podobnych kompetencjach, ale jedni są świeżo po studiach lub chcą się przebranżowić, a inni już pracowali komercyjnie przy danych, to zazwyczaj wybiorą drugą opcję. Wynika to z tego, że taka osoba ma większe obycie, będzie działała sprawniej i szybciej będzie wchodziła na jeszcze wyższe poziomy kompetencji (choć oczywiście nie musi być tak zawsze).

    2. Wymagane umiejętności „praktyczne”

    Osobiście nie lubię podziału na umiejętności „teoretyczne” i „praktyczne”, bo w danetyce to rzeczy mocno powiązane i przeplatające się, ale na potrzeby tego wywodu przyjmijmy taki uproszczony podział.

    Mogłoby się wydawać, że junior to ktoś, kto ma wiedzę raczej teoretyczną, a praktyczne umiejętności zdobędzie w pracy (i kiedyś tak rzeczywiście było). Niestety, oczekiwania są inne – dzisiaj kandydat powinien potrafić samodzielnie rozwiązywać problemy od A do Z.

    Czy w praktyce junior realizuje całe projekty samodzielnie? Zazwyczaj nie, choć zdarzają się wyjątki (czasem wynikające z dobrej organizacji, a czasem z oszczędzania na doświadczonych specjalistach). Jednak najczęściej junior jest częścią zespołu i wykonuje wybrane zadania. Dlaczego więc musi umieć samodzielnie realizować całe projekty? Po pierwsze, chodzi o wszechstronność – jeśli ktoś potrafi obsłużyć różne etapy projektu, to jest dla firmy bardziej użyteczny (takimi etapami mogą być np.: wyciąganie danych SQL-em, eksperymenty z algorytmami, wdrażanie kodu na produkcję, tworzenie aplikacji do wizualizacji działania modelu, itd.). Po drugie, pojedyncze elementy projektu mogą być na tyle skomplikowane, że ich realizacja jest równie złożona jak najpoważniejsze projekty, które adepci sztuki data science realizują podczas nauki. Dlatego kompetencje wykonania pełnego procesu od „researchu”, poprzez zaproponowanie i zbadanie rozwiązań, do komunikacji wyników są bardzo pożądane.

    3. Wymagana znajomość różnych technologii

      Zakres stosowanych technologii w data science jest szeroki, co przekłada się na duże wymagania. Znajomość SQL’a i Pythona na dobrym poziomie to absolutna podstawa, a do tego zazwyczaj dochodzi znajomość Gita. Często pojawiają się dodatkowe wymagania, jak technologie chmurowe (Azure/AWS/GCP), narzędzia big data (np. Spark), biblioteki do sieci neuronowych (TensorFlow/PyTorch) czy biblioteki do pracy z modelami językowymi.

      Na stanowiskach juniorskich są to raczej atuty „nice to have”, ale jeśli na jedno miejsce aplikuje 100 osób, a niemal wszyscy znają SQL-a i Pythona, to pracodawca prawdopodobnie skupi się w pierwszej kolejności na osobach z szerszymi kompetencjami. Oczywiście wynika to z faktu, że ktoś znający narzędzie od razu będzie je efektywnie używał, w przeciwieństwie do osoby, które dopiero będzie się go musiała uczyć. Znajomość różnych narzędzi jest tym bardziej istotna, gdy aplikujemy także na stanowiska mid-level (a nawet jeśli szukamy pierwszej pracy w data science, ale mamy już jakieś doświadczenia z danymi, to jak najbardziej warto aplikować na takie ogłoszenia; może to być wręcz konieczne, ze względu na małą liczbę ofert juniorskich).

      4. Umiejętności miękkie

        Możemy być świetni technicznie, ale jeśli nie potrafimy dobrze przedstawić naszych kompetencji, czy to „pisemnie” czy „ustnie”, to nasze szanse na zatrudnienie mocno spadają. Nawet zaawansowane projekty w portfolio nie będą wiele warte, jeśli nie przedstawimy ich skutecznie. Dlaczego w data science komunikacja jest bardzo ważna? Bo pracujemy nad trudnymi zagadnieniami i rozmawianie o nich jest sztuką. I dlatego, że dużą częścią naszej pracy będzie konsultowanie naszych działań z współpracownikami czy komunikowanie rezultatów naszej pracy.

        Czy potrafimy przystępnie wytłumaczyć wyniki analiz osobom nietechnicznym? Czy umiemy jasno opisać wykorzystaną przez nas skomplikowaną procedurę analityczną? Czy przekonująco argumentujemy swoje pomysły i rozwiązania? Jeśli nie, to nasze kompetencje techniczne będą tymi niedoborami przykryte. Co więcej, dobra komunikacja, która może zadecydować o naszym być albo nie być, zaczyna się już na etapie CV – jeśli nie potrafimy dobrze pokazać swojej wartości jako kandydata, to możemy zostać pominięci już na starcie. To samo dotyczy projektów w portfolio – jeśli nie prezentują się one dobrze, to ich wartość merytoryczna może zejść na drugi plan.

        5. Wymagane studia związane z data science

          To bariera dla osób bez wykształcenia powiązanego z danetyką (matematyka, fizyka, ekonometria itp.). Dlaczego pracodawcy preferują absolwentów tych kierunków? Wymieńmy dwa główne powody:

          1. Zdolności analityczne – profesjonalna analiza danych wymaga umiejętności zauważania prawidłowości, trafnego interpretowania obserwowanych w danych zjawisk, wyciągania poprawnych wniosków, drążenia w danych w poszukiwaniu odpowiedzi na skomplikowane pytania, stawiania hipotez i ocenie przy jakich założeniach będą one spełnione, itd. Studia silnie związane z matematyką właśnie takie zdolności rozwijają.
          2. Matematyczna osadzenie dziedziny – uczenie maszynowe opiera się na modelach i algorytmach matematycznych. Ich dobre zrozumienie wymaga posiadania pewnego aparatu matematycznego, a ich sprawne używanie – obycia w pracy z nimi. To są kompetencje i doświadczenia, które zdobywa się w ramach wspomnianych studiów (np. matematyczne procedury optymalizacji, modele fizyczne czy modele statystyczne dla ekonomii).

          Tego typu studia dają zatem wiedzę i doświadczenie, które są po prostu fundamentem kompetencji w obszarze data science. Oczywiście brak takiego wykształcenia nie oznacza z automatu, że ktoś nie nadaje się do tej pracy, ale dla pracodawcy absolwent kierunku ścisłego to po prostu „bezpieczniejsza” opcja.

          6. Brak wyróżników w CV

          Jeśli w ogłoszeniu o pracę wymagania są podstawowe (np. SQL, Python, ML), to o zaproszeniu na rozmowę mogą zadecydować „szczegóły”. Czy mamy w portfolio jakiś ciekawy, przykuwający uwagę projekt, czy same oklepane, realizowane przez wszystkich początkujących w tej branży? Czy z CV da się odczuć, że mamy dobre umiejętności miękkie? Czy z CV da się wywnioskować, że jesteśmy osobami proaktywnymi i zaangażowanymi? Czy z CV widać, że naprawdę interesujemy się tą dziedziną, a nie tylko szukamy jakiejkolwiek pracy? Jeśli nie wyróżnia nas nic, to niestety będziemy na końcu kolejki do otrzymania zaproszenia na rozmowę.

          Słowa końcowe

          Podsumowując, obecne realia w branży data science są takie, że pracodawcy mają bardzo duży wybór, a przez to, to kandydat musi walczyć o to, żeby się przebić. Samo dostanie zaproszenia na rozmowę jest dużym krokiem do wykonania i do tego potrzebne jest przekonujące CV. A jak już to zaproszenie dostaniemy, to na rozmowie trzeba wykazać się solidną wiedzą i kompetencjami – ogarnianie tematów “jako tako” po prostu nie wystarczy. Co również może być nie bez znaczenia, trzeba rozważać również podjęcie pierwszej pracy jako stażysta lub praktykant, co wiąże się z niezbyt atrakcyjnymi warunkami. Co do zasady warunki pracy w data science są atrakcyjne, ale zazwyczaj dopiero po przebiciu się przez poziom juniorski. Zaznaczmy jednak, że mówimy tu o ogólnej sytuacji na rynku, natomiast dostanie pracy to ostatecznie zawsze kwestia mocno indywidualna, więc nie dla każdego znalezienie tej pracy musi być trudne.

          A co konkretnie należałoby zatem zrobić, żeby tę pracę dostać? W tym miejscu nie będziemy w to wchodzić, ponieważ to temat rzeka wymagający dłuższych tekstów lub wypowiedzi. Ale w niniejszym artykule postarałem się rozbić wyzwanie zdobycia pierwszej pracy w data science na czynniki pierwsze, ponieważ uważam, że takie zgłębienie tematu może pomóc świadomiej kierować swoim rozwojem. Jeżeli szukasz takiej pracy, możesz ocenić jak wygląda Twoja sytuacja w kontekście powyższej „rozpiski” i zastanowić się, co możesz zrobić, aby poszczególne trudności nie blokowały Cię na drodze do branży data science.

          Zapraszam Cię do tego, żeby ten artykuł z Twoim udziałem stał się źródłem (bez)cennej życiowej wiedzy – jeśli masz doświadczenia w poruszanym temacie, wypowiedz się w komentarzach! Niech będą one merytorycznym źródłem pomagającym innym – takim, jakich brakuje wśród internetowego szumu. A jeśli masz pytania – zadaj je. Dyskusja w komentarzach może być jeszcze bardziej pomocna niż artykuł 😉

          Norbert Ryciak
          Norbert Ryciak
          Artykuły: 2

          Jeden komentarz

          1. To prawda – jest ciężko. Zderzyłam się z prawie każdą barierą, o jakiej tu mowa… Myślę, że największymi z nich były brak doświadczenia i kierunkowego wykształcenia. Nie miałam wielu zaproszeń na rozmowy – to naprawdę podcina skrzydła.

            Jednak zadziałała u mnie strategia: przeorganizować życie tak, aby móc w pełni skupić się na przebranżowieniu. Zainwestowałam w porządny kurs, a potem dalej się uczyłam, robiłam własne projekty, żyłam tym tematem, otaczałam się nim na wszystkie możliwe sposoby, nawet zdecydowałam się na studia. I rzeczywiście – po roku zaczęłam pierwszą pracę w data science. Najlepsza decyzja w życiu, choć łatwo nie było 🙂
            Gdybym miała coś zmienić, to zaczęłabym wcześniej aplikować – od momentu, gdy miałam coś sensownego do pokazania w CV. Przechodzenia przez procesy rekrutacyjne w nowej branży też trzeba się nauczyć – najlepiej w praktyce. Każda rozmowa i każde zadanie rekrutacyjne to cenne doświadczenie.

            Dzięki za tę reminiscencję – czekam na kolejne artykuły!

          Dodaj komentarz

          Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *