Opened 14 years ago

Closed 14 years ago

#26 closed task (fixed)

Izdvajanje originalnih stringova iz KDE-a

Reported by: Andrej Dundović Owned by:
Priority: major Milestone: Predradnje
Component: Informatički rječnik i glosar Version:
Keywords: glosar, KDE, skripte Cc:

Description

Cilj je izvući sve originalne (engleske) stringove iz svih KDE-ovih POT datoteka.

Stringovi u POT datotekama uvijek počinju s "msgid" ili "msgid_plural" (za plural) koje treba poslije ukloniti.

Treba ukloniti i sve prazne linije, HTML tagove te akceleratore.

 # 1. vadi sve originalne stringove iz pot datoteka 
 # 2. uklanja "msgid" iz linija 
 # 3. uklanja sve " na kraju reda 
 # 4. uklanja sve "HTML" tagove (*neki rijeci koje treba prevesti nalaze se unutar HTML taga) 
 # 5. uklanja sve prazne redove 
 # 6. uklanja akceleratore 
 # 7. sprema u datoteku 
 grep -shR msgid summit/messages/*[^svn]*/*[^svn]*.pot | \
 sed \
 -e 's/^msgid.* "//' \
 -e 's/<[^>]*>//g' \
 -e 's/\"$//' \
 -e '/^$/d' \
 -e 's/\&\([a-zA-Z]\)/\1/g' \
 > ../../skripte/kde_all_apps_pot.txt

Change History (3)

comment:1 Changed 14 years ago by Andrej Dundović

Slična je stvar s dokumentacijom (samo je putanja promijenjena):

 grep -shR msgid summit/docmessages/*[^svn]*/*[^svn]*.pot | \
 sed \
 -e 's/^msgid.* "//' \
 -e 's/<[^>]*>//g' \
 -e 's/\"$//' \
 -e '/^$/d' \
 -e 's/\&\([a-zA-Z]\)/\1/g' \
 > ../../skripte/kde_all_docs_pot.txt 

comment:2 Changed 14 years ago by Andrej Dundović

I zadnji bitan sed izraz je onaj koji stavlja svaku rečenicu u zaseban red:

sed 's/\([\.!?]\) \([A-Z0-9]\)/\1\n\2/g' kde_all_apps_pot.txt > kde_all_apps_sep

To bi bilo to - valjda :-)

comment:3 Changed 14 years ago by Andrej Dundović

Resolution: fixed
Status: newclosed

Mislim da je ovaj zadatak više-manje gotov.
Konačne datoteke KDE-ova korpusa nalaze se ovdje.

Moguće su modifikacije (npr. da se rečenice rastavljaju i na zarezima), ali to se lako promijeni:
sed 's/\([\.!?,;]\) \([A-Z0-9]\)/\1\n\2/g'

Note: See TracTickets for help on using tickets.