czwartek, 25 lipiec 2019 12:52

Czy musisz znać SQL żeby zostać Data Scientist?

Napisała
Oceń ten artykuł
(1 głos)

W sumie... to tak. Jak długo 'data' pozostaje w data scientist, SQL pozostanie na ważnej pozycji. Związek SQL z Data Science jest jednak bardziej złożony.

 

Nauka o dużej ilości danych ma szeroki zakres, a data scientist powinien mieć dogłębną znajomość jednego lub kilku różnych źródeł : matematyki, machine learning, informatyki, badań statystycznych, przetwarzania danych i wiedzy z konkretnego badanego tematu. Szeroka działka pracy z danymi to gromadzenie, analiza, czy przetwarzanie. 

 

Dlaczego Data Science zyskuje na popularności?

Świat cyfrowy sięga szczytów - a razem z nim rosnące wymagania i rozbudowane strategie marketingowe. To dane stały się kluczem do wszystkich celów marketingowych. Na przykład, jeśli chcę kupić nowy telefon, odwiedzam sklepy internetowe, przeglądam różne marki, umieszczam kilka w moim koszyku, ale decyduję się na późniejszy zakup po jakimś czasie. Sklep internetowy zapisuje mój koszyk i historię przeglądania, a gdy wrócę później, pokaże mi propozycje kolejnych telefonów. Nawet jeśli nie kupię, sprzedawca wyśle mi e-maila z przypomnieniem, że mój koszyk „wciąż na mnie czeka”. Dane odgrywają zatem najważniejszą rolę w tworzeniu relacji między mną -kupującym a sprzedającym. Im więcej danych klienta wyfruwa, tym bardziej dostosowywany jest strumień przychodzący. I dotyczy to nie tylko handlu elektronicznego.



Opieka zdrowotna, produkcja, bankowość, finanse i transport.

SQL jest ważną częścią całej działki. Jeśli chcesz być analitykiem - polecane jest nauczyć się SQL wraz z C/R/Python - do wyboru.

 

Dlaczego ten cholerny SQL?

Chociaż istnieją bazy danych NoSQL, które oferują szybkość i wydajność, bazy danych SQL są nadal najczęściej wykorzystywane do wszystkich praktycznych celów. Powód jest bardzo prosty- jest więcej programistów, którzy rozumieją technologię SQL, dlatego wsparcie i dokumentacja są bardziej obfite (a stackoverflow pełny odpowiedzi). Co więcej, integralność danych jest jednym z kluczowych czynników i dlatego SQL wyróżnia się na tle dowolnej bazy danych NoSQL. Żadnych duplikatów laughing

 

 

Eee....  Co to jest SQL?

SQL to system zarządzania relacyjnymi bazami danych używany do przechowywania, pobierania, aktualizowania i odczytywania danych z bazy danych. Jeśli zapoznasz się z SQL możesz go nawet polubić.

No to przypuśćmy, że chcesz poznać popularność portalu „Game Monster” i artykułów autorstwa „aikokami”, sprawdzając, ilu użytkowników czytało jej artykuły. Ponieważ SQL jest nieźle zorganizowanym językiem, możesz machnąć taką strukturę:

tabela page visits- id_user, id_time_of_visit, article_id itp.
article_details - category, url, article_id
articles - article_id, tittle, author, creation_date.

Aby uzyskać te dane, musimy połączyć te trzy tabele, używając niektórych typowych kolumn. W tym przypadku article_id jest wspólny dla wszystkich trzech tabel co ułatwia zadanie i pozwala napisać 'zapytanie' które zwróci nam niezbędne szczegóły.

 

Poziom skomplikowania

W rzeczywistych scenariuszach ten rodzaj systemu może być na wielu poziomach, i zawierać ogromne dane. Codzienne miliony danych są przechowywane i analizowane w różnych celach.

Teraz wyobraź sobie, że robisz to wszystko bez użycia SQL cool

Podczas gdy niektórzy ludzie chcą wierzyć, że rola SQL w pracy analityka zmniejsza się, to niestety tak nie jest. SQL zostaje.

 

Podstawy SQL:

SQL może zrealizować kilka podstawowych typów zapytań:

  • DML (Data Manipulation Language) – select, insert, delete, update
  • DDL (Data Definition Language) – create, drop, alter
  • DCL (Data Control Language) – grant, revoke
  • TCL (Transaction Control Language) – begin, commit, rollback

 

Jeśli na tym etapie myślisz, że zabawy z danymi to coś dla Ciebie, a tytuł Data Scientist brzmi jak coś dla Ciebie - zdecydowanie zacznij uczyć się SQL.

Czytany 309 razy Ostatnio zmieniany czwartek, 25 lipiec 2019 16:17

Please publish modules in offcanvas position.