Forum
>>
Programmazione Python
>>
Files e Directory
>>
Seleziona righe da un file csv in base ad un valore contenuto in una colonna
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
Scritto da Lucaccino |
2017-11-09 13:53:07 - Seleziona righe da un file csv in base ad un valore contenuto in una colonna
|
Ciao a tutti, mi sono appena iscritto al forum
Mi sto da un po’ di tempo interessando a Python e anche se molto lentamente riesco a fare qualche piccolo progresso, pur essendo agli inizi ed avendo ancora molto da imparare a riguardo. Ho questo problema: ho un certo numero files csv ognuno relativo ad un individuo contenente dati genetici Da ognuno di questi vorrei estrapolare i dati contenenti ad esempio quelli con la colonna Chr = Y Sono riuscito a fare questa cosa, ma solo per un unico file alla volta Questo è il codice che ho scritto import pandas as pd df = pd.read_csv('Ind1.csv') print df df1 = df[df['Chr']=='Y'] df1.to_csv('NewInd1.csv', sep=',', decimal='.', index=False) questo è il file di input usato (in formato csv) SNP,Chr,Allele1,Allele2 SNP01,Y,A,A SNP02,Y,B,B SNP03,X,C,C SNP04,mt,D,D SNP05,mt,E,E e questo il file di output risultante SNP,Chr,Allele1,Allele2 SNP01,Y,A,A SNP02,Y,B,B questo è solo un piccolo esempio, la lunghezza di ciascun file supera le 100000 righe e di questi ne ho diversi, quindi l'ideale sarebbe analizzare i files contenuti in una directory e salvarli in una seconda ringrazio in anticipo chi può darmi una mano allego dei files di esempio --- Ultima modifica di Lucaccino in data 2017-11-09 13:56:59 --- |
Pagina: 1
Esegui il login per scrivere una risposta.