topicModelingTickets/config.ini

76 lines
1.8 KiB
INI

[thesaurus]
input=deWordNet.xml
pickle_file=thesaurus_dict.pkl
[spellchecking]
input=deu_news_2015_1M-sentences.txt
pickle_file=words_dict.pkl
[lemmatization]
input=lemmas.txt
pickle_file=lemma_dict.pkl
[nouns]
input=de_nouns.txt
input1=nomen.txt
input2=nomen2.txt
pickle_file=nouns_list.pkl
[firstnames]
input=firstnames.txt
pickle_file=firstnames_list.pkl
[de_stopwords]
input1=de_stopwords_1.txt
input2=de_stopwords_2.txt
input3=de_stopwords_3.txt
pickle_file=de_stopwords_list.pkl
[en_stopwords]
pickle_file=en_stopwords_list.pkl
[logging]
level=INFO
filename=log/topicModelTickets.log
[de_corpus]
#input=M42-Export/Tickets_mini.csv
#input=M42-Export/Tickets_small.csv
input=M42-Export/de_tickets.csv
path=corpi/
[en_corpus]
input=M42-Export/en_tickets.csv
path=corpi/
[tickets]
content_collumn_name=Description
metaliste=TicketNumber,Subject,CreatedDate,categoryName,Impact,Urgency,BenutzerID,VerantwortlicherID,EigentuemerID,Solution
[preprocessing]
autocorrect = false
#true
custom_words=problem,without,aenderung,hahn,verantwortlicher,rolle,status,fehlgeschlagen,aenderung,test,erwuenscht,antragsteller,bemerkung,tu,uni,prof,bezeichnung,gramm,type,eintrag,element,nutzer,einrichtung,abteilung,gebaeude,raum,ansprechpartner,geehrt,dr,not,frage,betreff,gerne,dame,herr,frau,hilfe,moeglichkeit,beste,freuen,voraus,problem,lauten,bedanken,voraus,hallo,gerne,freundlich,fragen,fehler,bitten,ehre,lieb,liebe,gruesse,helfen,versuchen,unbestimmt,woche,tadelos,klappen,mittlerweile,bekommen,erreichbar,gruss,auffahren,vorgang,hinweis,name,gruss,id,erfolg,folge,team,absender,versenden,vorname,strasse,prozess,portal,moeglichkeit,fremd,wende,rueckfrage,stehen,verfuegung,funktionieren,pruefen,hoffen,ok,januar,februar,maerz,april,mai,juni,juli,august,september,oktober,november,dezember