La moderna oftec-vortaro de Z.D. Usmanov, F. Ŝukurov kaj S. Jokubzoda el Duŝanbeo (Taĝikio) (dato ne indikita) baziĝas sur perkomputila analizo de "originalaj kaj tradukitaj verkoj de 32 aŭtoroj" kun sume 1.450.000 vortoj, preskaŭ unu kaj duona miliono do.

Por ĉiu oftec-vortaroj oni devas difini almenaŭ du aspektojn: Unue, kio estas "vorto", t.e. kio estas la unuaĵo nombrinda, kaj due, sur kiu tekstaro (korpuso) oni volas bazi sin? Usmanov k.a. iom scienc-lingvaĵe difinas ĝin tiel, ke por ili ekzemple formoj kiel vidi, vidis, vidas, vidos, vidu, vidus, vidinta, vidanta, vidita, vidata, vidiĝi, vidiĝis, vidigikrome substantivoj kiel vidaĵo, vidaĵoj, konstruitaj el la radiko vid estas unu "vorto". Simile laŭ ilia difino "homaro" ne estas vorto aparte nombrinda, sed nombrita sub hom (kaj simile hometo, homego, homido, homino, homarano, homaranoj, homiĝi, homigi ktp.). Bedaŭrinde ili ne klarigas, kiel ili nombras kunmetaĵojn kiel admiral-ŝipo. Ĉu aparte nombrinda kiel propra vorto, ĉu nombrinda por admiral aŭ por ŝip aŭ por ambaŭ?

La tekstojn, kiujn ili analizis, ili listigas en Suplemento.

Kion ili eltrovis? 40 tiaj "vortoj" (leksemoj kun siaj paradigmoj) kovras 50% de la traserĉitaj tekstoj. La du plej oftaj estas la kaj kaj. Sekvas de, mi, esti, en, ne, li, al kaj kiel deka plej ofta vi. ŝi sekvas nur sur la 19-a pozicio (kompare al li sur la 8-a kaj ili sur la 17-a). La unua adjektivo, bona, okupas la 37-an lokon, la unua substantivo, homo, la 39-an. 190 vortoj (la 40 plej oftaj plus pliaj 150) kovras jam 75% de la tekstoj priesploritaj, pliaj 80, do sume la plej oftaj 270, kovras 80%. La dua adjektivo (51-a leksemo) estas granda. Nu, kaj tiel plu. Kiu ŝatas, povas mem esplor-promeni tra la listoj klakante sur la supraj ligiloj.

Kaŝitan indikon pri la korpuso donas la unua kaj sola adjektivo pri etno. En la oftec-listo de Usmanov k.a. ĝi estas nek pola, angla, franca, germana, sed ... - ĝuste vi devenis - rusa (pozicio 178). Aliaj tiaj vortoj tute ne aperas inter la 270 plej oftaj leksemoj. Rapida kontrolo en la listo de traserĉitaj verkoj tuj klarigas la konstaton: Plej multaj (kaj plej longaj) verkoj estas tradukoj el la rusa, precipe de Jurij Finkel kaj Ak. Sergej Pokrovskij el rusa Esperanto-retejo. Tio memorigas pri esperanta oftec-vortaro el iama GDR, kie la vorto socialismo havis surprize altan pozicion neatenditan. La kialo estis simple, ke bazo de vort-nombrado estis tiuepokaj politikaj tekstoj el soc-landoj, i.a. el la socialisma revuo Paco k.a. Atendeble, ke la vorto ŝi havus pli altan pocizion, se oni traserĉus (nur) feminismajn tekstojn kaj besto-nomoj pli altan, se oni baziĝus sur infan-libroj (ĉe Usmanov k.a. neniu besto inter la 270 plej oftaj vortoj, eĉ ne hundo aŭ kato). Se bazo ne estus (precipe kaj ĉefe) rusa literaturo, sed tekstoj de - ekzemple - Ĉina Radio Internacia, mi ne estus surprizita, se la plej ofta adjektivo pri etno estus ĉina anstataŭ rusa.

Per tiu indiko mi neniel volas kritiki la laŭdindan laboron de la aŭtoroj, sed nur atentigi pri la evidentaĵo, ke per la difino de la korpuso oni antaŭfiksas parton de la rezulto. Ĉiukaze oni do nur tre prudente povas interpreti tiajn oftec-listojn - kaj kompari ilin estas eĉ pli malfacile. Sed tio - kompreneble - ankaŭ estas banala konstato. Waringhien jam antaŭ pli ol 50 jaroj (en 1958) prave demandis: Ĉu vortstatistiko sufiĉas por la starigo de bazvortaro?

Kion ajn oni volas konkludi el la studo - ni ja havas plian kialon gratuli al la samideanoj el Duŝanbeo kaj danki al ili pro tiu kontribuo al esperantologio.

P.S.: EBEA registras i.a. jenajn oftec-studojn (serĉu je "oftec" kaj "statistik", mi citas ĉefe la eble ne tiom konatajn fruajn):

1927: Rublev, S. Provo de kvanta element-analizo en la lingvo Esperanto. En: Kvardek jaroj. Kolekto da orig. verketoj .. 40-jara jubileo de Esperanto. SAT 1927, p. 7-15 (vd. la bildon)

1932: Studejo De Zamenhofa Gramatiko, Tokio. Teksto-Kritiko de la Paroladoj de Zamenhof laŭ Originala Verkaro de D-ro Dietterle. En: Lingva Kritiko 1932:1:07 (aŭg.), p. [1-2] (vort-statistiko pri la paroladoj de Zamenhof)

1950: Blaas, Leo. Statistiko de 50.000 tekstvortoj. En: Esperantologio 1950:1:2, p. 107-132

1956: N.I. Internacie plej oftaj vortoj. En: Revuo Esperanto 1956/11 (612), p.173 (Listo de 577 plej oftaj vortoj de «al» ĝis «vizit» grupigitaj en ok oftec-kategorioj).

1958. Waringhien, Gaston. Ĉu vortstatistiko sufiĉas por la starigo de bazvortaro? En: Sciencaj studoj 1958, p. 27-30

1959: Sadler, Victor. Relativaj oftecoj de kelkaj lingvaj elementoj en Esperanto. En: Scienca Revuo 1959:10:2-3 (38-39), p. 67-72.

1967: Harry, R. Relativaj oftecoj de lingvaj elementoj en Esperanto. En: Scienca Revuo 1967:18:2 (70), p. 49-50 (Tabelo pri ofteco de fonemoj).

1968: Thomson, A.W. Vortofteco. En: Scienca Revuo vol. 19 (1968), n. 2, p. 41-47 (Ofteco de unusilabaj vortoj en Fabeloj de Andersen IV. Homaj, lokaj kaj aliaj nomoj en la sama verko).

1969: Sonnenfeld, E. Pri la artikolo "Vortofteco" [de Thomson]. En: Scienca Revuo 1969/1, p. 16.

k.m.a.

Unua versio 21-a de novembro 2009; lasta ĝisdatigo (aldono de la Oftec-Vortaro de Dietze): 14-a de januaro 2010