Opened 13 years ago
Closed 13 years ago
#26 closed task (fixed)
Izdvajanje originalnih stringova iz KDE-a
Reported by: | Andrej Dundović | Owned by: | |
---|---|---|---|
Priority: | major | Milestone: | Predradnje |
Component: | Informatički rječnik i glosar | Version: | |
Keywords: | glosar, KDE, skripte | Cc: |
Description
Cilj je izvući sve originalne (engleske) stringove iz svih KDE-ovih POT datoteka.
Stringovi u POT datotekama uvijek počinju s "msgid" ili "msgid_plural" (za plural) koje treba poslije ukloniti.
Treba ukloniti i sve prazne linije, HTML tagove te akceleratore.
# 1. vadi sve originalne stringove iz pot datoteka # 2. uklanja "msgid" iz linija # 3. uklanja sve " na kraju reda # 4. uklanja sve "HTML" tagove (*neki rijeci koje treba prevesti nalaze se unutar HTML taga) # 5. uklanja sve prazne redove # 6. uklanja akceleratore # 7. sprema u datoteku grep -shR msgid summit/messages/*[^svn]*/*[^svn]*.pot | \ sed \ -e 's/^msgid.* "//' \ -e 's/<[^>]*>//g' \ -e 's/\"$//' \ -e '/^$/d' \ -e 's/\&\([a-zA-Z]\)/\1/g' \ > ../../skripte/kde_all_apps_pot.txt
Change History (3)
comment:1 Changed 13 years ago by
comment:2 Changed 13 years ago by
I zadnji bitan sed izraz je onaj koji stavlja svaku rečenicu u zaseban red:
sed 's/\([\.!?]\) \([A-Z0-9]\)/\1\n\2/g' kde_all_apps_pot.txt > kde_all_apps_sep
To bi bilo to - valjda :-)
comment:3 Changed 13 years ago by
Resolution: | → fixed |
---|---|
Status: | new → closed |
Mislim da je ovaj zadatak više-manje gotov.
Konačne datoteke KDE-ova korpusa nalaze se ovdje.
Moguće su modifikacije (npr. da se rečenice rastavljaju i na zarezima), ali to se lako promijeni:
sed 's/\([\.!?,;]\) \([A-Z0-9]\)/\1\n\2/g'
Slična je stvar s dokumentacijom (samo je putanja promijenjena):