top of page

Analiza datelor cu ChatGPT

  • Poza scriitorului: Ai4business
    Ai4business
  • 7 mar.
  • 4 min de citit

Analiza datelor pare complicata, si probabil este, dar folosind ChatGPT, ne putem usura foarte tare munca. Voi folosi GPT-4.5, ultimul model lansat


In acest articol o sa discutam despre:

  • Cum sa creezi propriile tale seturi de date direct in ChatGPT, fara sa fii nevoit sa descarci sau sa folosesti date externe.

  • Ce inseamna „curatarea” datelor si de ce este esentiala inainte sa analizezi sau sa vizualizezi informatii.

  • Cum putem “interactiona cu datele”.

  • Cum sa manipulezi datele direct in ChatGPT, generand grafice interactive si relevante.

  • Cum sa interoghezi datele.

  • Cum sa generezi grafice.


Generarea a unui set de date


In scopul de a ne familiariza cu seturile de data, nu o sa adaugam un set de date (lucru pe care in mod normal l-am face), ci vom crea unul, direct in GPT.


Propt-ul penru a genera simplu un set de date in ChatGPT:


"Creeaza un set de date cu care sa pot exersa analiza de date. Vreau ca acest set de date sa contina 4 factori si sa fie bazat in principal pe o companie, veniturile acesteia si modul in care distribuie acele venituri intre anumite pozitii din companie. Poti adauga si alti factori (coloane) care au legatura cu ceea ce vreau, pentru a face acest set de date mai interesant. Creeaza acest set de date cu 100 de randuri (100 de angajati).”


In momentul asta avem un set de date, asa cum am cerut.


ree

In dreapta sus avem doua iconite:

  • Download: putem descarca setul de date in format csv pe calcuator / laptop

  • Expand: daca apasam pe acest buton, pe ecran vom vedea o varianta marita a tabelului si aici avem acces si la alte functionalitati.


ree

Felicitari! Ti-ai creat primul set de date :D Asta e punctul de plecare in analiza datelor, si anume, seturi de date. Indiferent ca le generam, sau le incarcam din calculator.


Curatarea datelor

Inainte de analiza, este esential sa verifici si sa "cureti" datele.

O sa folosesc fisierul pe care l-am generat (si pe care l-am descarcat) in pasul urmator, si il voi incarca intr-un chat nou. Pe langa, o sa adaug prompt-ul de mai jos


"Curata si formateaza aceste date, eliminand erorile sau informatiile lipsa."


ree

ChatGPT va verifica automat integritatea si formatul datelor pentru a ne asigura ca analiza ulterioara va fi corecta.

Retine ca, acest past este foarte important. Avem nevoie de date “curate” ca sa putem face analiza pe ele.


“Curatarea si formatarea” se refera la actiuni pentru a imbunatati datele (nu de a le modifica) cum ar fi:

  • Sa ne asiguram ca tipurile de date sunt corecte. Adica unde trebuie sa avem tipuri de date de tip numere sa fie numere, unde trebuie sa fie procente sa fie procente, etc. Sa nu ne trezim ca pe coloana “salariu” avem celule in care sunt litere.

  • Sa ne asiguram ca nu avem date lipsa sau duplicate

  • Sa ne asiguram ca datele sunt formatate corect. Sa nu avem pe aceasi coloana sume in care se foloseste ca separator ba virgula, ba punctul.

  • Sa ne asiguram ca in acele coloane cu sume, valorile adunate dau sumele corecte.


Interactiune cu datele

Asemantor unui document excel, putem sa selectam o coloana sau mai multe, o celula sau mai multe, unul sau mai multe randuri, si sa "discutam" cu GPT fix pe acele date pe care le-am selectat.


In poza de mai jos, am ales 3 coloane (cu albastru), iar in dreapta jos, in chat, vedem ca am selectat “3 coloane”

ree

Avand coloanele selectate am intrebat: “dintre angajatii cu experienta de 1 an, care este cel mai bine platit angajat si care este cel mai mare bonus obtinut de catre un angajat cu 1 an de experienta?”. Iar raspunsul primit:


"Cel mai bine plătit angajat cu 1 an experiență este Angajatul cu ID-ul 5, având un salariu brut de 14,774. Cel mai mare bonus anual obținut de un angajat cu 1 an experiență este de 4,893."


Exemplu de manipulare si adaugare a datelor

Poti adauga rapid noi coloane sau date suplimentare. Pentru ca nu imi vine in cap nicio idee o sa ii spun sa adauge o noua coloana, oricare ar fi ea:


"Mai adauga o coloana relevanta cu date pentru fiecare angajat."

ChatGPT va completa automat aceasta coloana cu valori relevante pentru analiza.


ree

Chiar daca nu ma deranjeaza atat de tare, as vrea ca venitul pe ora sa fie cu doua zecimale maxim iar toate datele referitoare la bani (salariu, bonus, etc) sa contina simbolul EUR.


ree

Peeeerfect!


Interogarea datelor

O sa folosesc datele pe care abia le-am creat si o sa pun diverse intrebari punctuale.


ree

Asta e o modalitate foarte buna si rapida de a afla diverse lucruri dintr-un set de date.


Generara graficelor

Daca vrem sa generam un grafic trebuie sa scriem un prompt. Nimic mai simplu:


“Vreau un pie chart cu media orelor lucrat per departament si cat % din totalul orelor lucrate reprezinta”


ree

Putem chiar sa schimbam culorile din chart si sa sescarcam chart-ul iar ulterior sa descarcam imaginea.


ree

In acest articol am prezentat elementele de baza in interactiunea cu seturi de data via ChatGPT. In zilele urmatoare voi posta noi articole pe acest subiect.


Bye!

 
 
 

Comentarii


bottom of page