Go to file
jannis.grundmann 3137dc6e54 topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
.idea xml2Corpus 2017-08-29 15:01:17 +02:00
M42-Export preprocessing abgeschlossen 2017-10-18 17:37:20 +02:00
java_LabledLDA topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
old aufgeräumt 2017-10-16 14:01:38 +02:00
.gitignore fehlende ordner geadded 2017-09-11 13:03:20 +02:00
DeReKo-2014-II-MainArchive-STT.100000.freq thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
abbkuerzungen.txt thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
backup.py textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00
cleaning.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
cleaning_bsp.txt topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
config.ini topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
corporization.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
deWordNet.xml bereit für weitern testrun 2017-09-25 13:12:23 +02:00
de_stop_words.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
deu_news_2015_1M-sentences.txt refactoring 2017-10-10 14:42:09 +02:00
firstnames.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
german_stopwords.txt thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
german_stopwords_full.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
init.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
lemmas.txt bereit für weitern testrun 2017-09-21 12:05:32 +02:00
lemmatization-de.txt lemmatizer gebaut 2017-09-20 15:22:13 +02:00
lexicalentries.xml thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
main.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
miscellaneous.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
nomen.txt topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
nomen2.txt thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
openthesaurus.csv preprocessing erstmal soweit fertig. 2017-09-11 12:12:28 +02:00
preprocessing.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
spell.py textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00
stopwords-de.txt lemmatizer gebaut 2017-09-20 15:22:13 +02:00
synsets.xml thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
test.py aufgeräumt 2017-10-16 14:01:38 +02:00
testo.py aufgeräumt 2017-10-16 14:01:38 +02:00
testra.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
ticketSamples.xml xml2Corpus 2017-08-29 15:01:17 +02:00
topicModeling.py topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
vornamen.txt textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00