Według Unite for Sight naukowcy organizują dane badawcze poprzez proces kodowania i nazywania. Naukowcy często używają oprogramowania statystycznego lub programów bazodanowych do przechowywania danych i tworzenia plików. Naukowcy muszą zorganizować dane przed rozpoczęciem analizy danych.
Naukowcy pobierają surowe dane z eksperymentu, obserwacji lub innej metody badawczej i przypisują każdą informację jako zmienną. Według University of California w Riverside sposób, w jaki naukowiec koduje zmienną, zależy od rodzaju zmiennej. Zmienna binarna otrzymuje kod zerowy lub jeden, podczas gdy zmienne ciągłe otrzymują numer kodu do możliwości opcji w badaniu. Rodzaj zmiennej informuje test statystyczny, którego używa naukowiec. Nawet niektóre badania jakościowe wykorzystują kodowanie do uporządkowania danych na kategorie. W oprogramowaniu statystycznym każda zmienna otrzymuje unikalną nazwę, która ułatwia naukowcom przeprowadzanie testów statystycznych lub wyszukiwanie danych dla określonej odpowiedzi.
Według danych naukowych Uniwersytetu Bostońskiego dane z każdego badania wymagają nazwy pliku do dalszej organizacji. Naukowcy wprowadzają dane i rozpoczynają organizację w programie komputerowym, gdy tylko naukowcy zdobędą pierwszą część danych. Opracowanie standardowego arkusza kodu poprawia spójność organizacji danych.