Go to file
jannis.grundmann 1a99d117ac thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
.idea xml2Corpus 2017-08-29 15:01:17 +02:00
M42-Export bereit für erstes topic modeling mit gesamter tickets.csv 2017-09-14 11:40:00 +02:00
java_LabledLDA thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
old fehlende ordner geadded 2017-09-11 13:03:20 +02:00
.gitignore fehlende ordner geadded 2017-09-11 13:03:20 +02:00
DeReKo-2014-II-MainArchive-STT.100000.freq thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
abbkuerzungen.txt thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
backup.py textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00
config.ini regex zum weiteren cleaning hinzugefügt 2017-09-15 14:32:44 +02:00
deWordNet.xml bereit für weitern testrun 2017-09-25 13:12:23 +02:00
de_stop_words.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
firstnames.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
german_stopwords.txt thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
german_stopwords_full.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
lemmas.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
lemmatization-de.txt lemmatizer gebaut 2017-09-20 15:22:13 +02:00
lexicalentries.xml thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
nomen.txt bereit für weitern testrun 2017-09-25 13:12:23 +02:00
nomen2.txt thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
openthesaurus.csv preprocessing erstmal soweit fertig. 2017-09-11 12:12:28 +02:00
preprocessing.py regex zum weiteren cleaning hinzugefügt 2017-09-15 14:32:44 +02:00
spell.py textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00
stopwords-de.txt lemmatizer gebaut 2017-09-20 15:22:13 +02:00
synsets.xml thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
test.py textcleaning macht immer noch keinen spass 2017-09-19 14:42:38 +02:00
testo.py thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
testra.py thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
ticketSamples.xml xml2Corpus 2017-08-29 15:01:17 +02:00
vornamen.txt textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00