Commit Graph

25 Commits

Author SHA1 Message Date
jannis.grundmann 412f25d8d8 refactoring.
jetzt kommt der umbau cleanedcoprus --> doctermmatrix --LDA & labaled_lines.txt --> LLDA
2017-12-11 12:10:40 +01:00
jannis.grundmann db7ea1a72a preprocessing überarbeitet 2017-12-08 11:06:07 +01:00
jannis.grundmann 66e4b972eb . 2017-11-29 16:31:30 +01:00
jannis.grundmann 873e9ff7d2 start auswertung 2017-11-27 12:49:05 +01:00
jannis.grundmann 4a3683635e refactored 2017-11-17 11:46:57 +01:00
jannis.grundmann 0a6a68b8aa lauffähige version 2017-11-06 12:54:59 +01:00
jannis.grundmann 6ea03b2f65 termiteplot für lda 2017-10-30 12:56:52 +01:00
jannis.grundmann 3137dc6e54 topicmodeling jgibbsllda lauffähig 2017-10-25 09:46:44 +02:00
jannis.grundmann 16d3e1cb70 preprocessing abgeschlossen 2017-10-18 17:37:20 +02:00
jannis.grundmann 17e45c30af weiter aufgeräumt 2017-10-17 10:13:49 +02:00
jannis.grundmann 56c8bce2d7 aufgeräumt 2017-10-16 14:01:38 +02:00
jannis.grundmann 4fe12679fb thesaurus erstellung luafzeit verbessert 2017-10-12 15:57:56 +02:00
jannis.grundmann 93e239756c refactoring. 2017-10-11 17:16:04 +02:00
jannis.grundmann 43955a17f2 refactoring 2017-10-10 14:42:09 +02:00
jannis.grundmann 092052dfe1 regex zum weiteren cleaning hinzugefügt 2017-09-15 14:32:44 +02:00
jannis.grundmann fff1e5d0fd pipe effizienter gemacht 2017-09-12 14:56:11 +02:00
jannis.grundmann 0319e415a3 last commit 11.9.17 2017-09-11 13:24:20 +02:00
jannis.grundmann 991353b1bb unsupervised und supervised-topic-training eingebaut. sollte man jez auf den datensatz loslassen können 2017-09-11 13:00:03 +02:00
jannis.grundmann 4dbb07ae3f preprocessing erstmal soweit fertig.
das mit der config wird noch verfeinert
2017-09-11 12:12:28 +02:00
jannis.grundmann 73a13551c6 composing geht irgendwie aber mehr probleme 2017-09-06 15:51:14 +02:00
jannis.grundmann 05b4f514d5 spacy-pipeline / python funciton-composing versucht 2017-09-05 11:52:39 +02:00
jannis.grundmann 11e77fad06 textcleaning refactored 2017-09-01 14:27:03 +02:00
jannis.grundmann 86ee5d7fba textcleaning verfeinert 2017-08-31 14:54:01 +02:00
jannis.grundmann bb9edcff25 openthesaurus debugging 2017-08-30 12:56:59 +02:00
jannis.grundmann 6292ee6cc7 xml2Corpus
openthesaurus eingebunden
2017-08-29 15:01:17 +02:00