Commit Graph

43 Commits

Author SHA1 Message Date
jannis.grundmann 412f25d8d8 refactoring.
jetzt kommt der umbau cleanedcoprus --> doctermmatrix --LDA & labaled_lines.txt --> LLDA
2017-12-11 12:10:40 +01:00
jannis.grundmann db7ea1a72a preprocessing überarbeitet 2017-12-08 11:06:07 +01:00
jannis.grundmann 66e4b972eb . 2017-11-29 16:31:30 +01:00
jannis.grundmann 873e9ff7d2 start auswertung 2017-11-27 12:49:05 +01:00
jannis.grundmann 7214911606 llda mit subjects und keywords korrigiert 2017-11-21 10:14:37 +01:00
jannis.grundmann 4a3683635e refactored 2017-11-17 11:46:57 +01:00
jannis.grundmann 0a6a68b8aa lauffähige version 2017-11-06 12:54:59 +01:00
jannis.grundmann ecc8c0c54a commit vor refactoring 2017-11-03 11:49:26 +01:00
jannis.grundmann 6ea03b2f65 termiteplot für lda 2017-10-30 12:56:52 +01:00
jannis.grundmann 3137dc6e54 topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
jannis.grundmann 16d3e1cb70 preprocessing abgeschlossen 2017-10-18 17:37:20 +02:00
jannis.grundmann 17e45c30af weiter aufgeräumt 2017-10-17 10:13:49 +02:00
jannis.grundmann 56c8bce2d7 aufgeräumt 2017-10-16 14:01:38 +02:00
jannis.grundmann 4fe12679fb thesaurus erstellung luafzeit verbessert 2017-10-12 15:57:56 +02:00
jannis.grundmann 93e239756c refactoring. 2017-10-11 17:16:04 +02:00
jannis.grundmann 43955a17f2 refactoring 2017-10-10 14:42:09 +02:00
jannis.grundmann b542c4285a eigene corpus-save/load methoden geschreiben 2017-10-09 12:50:34 +02:00
jannis.grundmann 3bfbebc894 thesaurus fertiggestellt 2017-10-02 14:31:33 +02:00
jannis.grundmann 1a99d117ac thesaurus auf basis von deWornNet weitergemacht 2017-09-28 12:42:05 +02:00
jannis.grundmann 33cfbe2f99 thesaurus auf basis von deWornNet angefangen 2017-09-26 11:03:09 +02:00
jannis.grundmann 6b8785d987 bereit für weitern testrun 2017-09-25 13:12:23 +02:00
jannis.grundmann 2ee9937d23 bereit für weitern testrun 2017-09-21 12:05:32 +02:00
jannis.grundmann 89ea2a863d lemmatizer gebaut 2017-09-20 15:22:13 +02:00
jannis.grundmann a380b57bfc textcleaning macht immer noch keinen spass 2017-09-19 14:42:38 +02:00
jannis.grundmann 20d9eed5b3 textcleaning macht keinen spass 2017-09-18 16:08:11 +02:00
jannis.grundmann 092052dfe1 regex zum weiteren cleaning hinzugefügt 2017-09-15 14:32:44 +02:00
jannis.grundmann 13ec7cdef4 bereit für erstes topic modeling mit gesamter tickets.csv 2017-09-14 11:40:00 +02:00
jannis.grundmann 26c0f37ec8 tickets.csv kann in corpus übertragen werden 2017-09-13 12:53:09 +02:00
jannis.grundmann fff1e5d0fd pipe effizienter gemacht 2017-09-12 14:56:11 +02:00
jannis e6548225e3 preprocessingpipe verfeinert 2017-09-11 17:29:54 +02:00
jannis 8b96076337 Merge remote-tracking branch 'origin/master'
# Conflicts:
#	openthesaurus.csv
#	preprocessing.py
#	test.py
2017-09-11 16:54:46 +02:00
jannis.grundmann 0319e415a3 last commit 11.9.17 2017-09-11 13:24:20 +02:00
jannis.grundmann 67e6f8845c fehlende ordner geadded 2017-09-11 13:03:20 +02:00
jannis.grundmann 991353b1bb unsupervised und supervised-topic-training eingebaut. sollte man jez auf den datensatz loslassen können 2017-09-11 13:00:03 +02:00
jannis.grundmann 4dbb07ae3f preprocessing erstmal soweit fertig.
das mit der config wird noch verfeinert
2017-09-11 12:12:28 +02:00
jannis.grundmann f09a261816 composing mit text-stream angefangen 2017-09-07 14:59:59 +02:00
jannis.grundmann 73a13551c6 composing geht irgendwie aber mehr probleme 2017-09-06 15:51:14 +02:00
jannis.grundmann 05b4f514d5 spacy-pipeline / python funciton-composing versucht 2017-09-05 11:52:39 +02:00
jannis.grundmann 11e77fad06 textcleaning refactored 2017-09-01 14:27:03 +02:00
jannis.grundmann 86ee5d7fba textcleaning verfeinert 2017-08-31 14:54:01 +02:00
jannis 68d8115344 openthesaurus refactored. 2017-08-31 10:38:29 +02:00
jannis.grundmann bb9edcff25 openthesaurus debugging 2017-08-30 12:56:59 +02:00
jannis.grundmann 6292ee6cc7 xml2Corpus
openthesaurus eingebunden
2017-08-29 15:01:17 +02:00