December 2008
  Sun Mon Tue Wed Thu Fri Sat  
    1 2 3 4 5 6  
  7 8 9 10 11 12 13  
  14 15 16 17 18 19 20  
  21 22 23 24 25 26 27  
  28 29 30 31        

Archives

December 2008 (4)
August 2008 (3)
April 2008 (2)
March 2008 (5)
February 2008 (2)
January 2008 (1)
December 2007 (3)
November 2007 (1)
October 2007 (1)

December 9, 2008

Kalkuli la manipulmontran ciferon de iu artikolo/teksto

La plej grava karaketerizo de tiu ĉi mezura metodo estas la leĝo de multnombreco, do kelkaj eraroj ne influas esence la finajn montro-ciferojn.

La t.n. manipulmontra cifero ricevas formon kaj laŭ subjektiva, kaj laŭ objektiva analizo de la tekstoj. Unue La Manipulanto priserĉas tiujn kvalifikajn vortojn, esprimojn, asertojn el la artikolo, kiuj restas sen pruvoj, pravigoj aŭ justigoj. Tiuj vortoj estas ruĝigitaj kaj kiam oni movas ilian muskursoron sur tiuj vortoj, vidiĝos pliaj detaloj pri la kialoj de ilia selekto.

Analizo de vortoj-esprimoj

Tiuj detaloj aŭ notoj enhavas ankaŭ subjektivajn aludojn, kiujn eblas komenti, sed laŭ nia intenco, nur tiam ruĝiĝas iu vorto, esprimo, se ĝi havas “problemon”. Por prikalkuli la manipulmontran ciferon ni prinombras la ruĝajn vortojn - tiu cifero helpos kalkuli la finan manipul-ciferon (2a formulo) - kaj signas ĝin per la litero K (kvalifikaĵoj) en la suba formulo.

Objektivaj statistiko kaj montro-ciferoj

Laŭ empiriaj rimedoj La Manipulanto konkludis, ke la plej neŭtr(al)aj vortoj nekvalifikaj en Esperanto estas la prepozicioj (ne ĉiuj!) plus kelkaj vortoj senkategoriaj (vidu sube!).

Prepozicioj: al, antaŭ, apud, cis, ĉe, ĉirkaŭ, da, de, depost, disde, dum, ekde, ekster, el, ĝis, inter, je, krom, kun, laŭ, malantaŭ, per, po, por, post, preter, pri, pro, sen, sub, super, sur, tra, trans

Plus kelkaj vortoj senkategoriaj: ajn, aŭ, baldaŭ, ĉar, ĉi, ĉu, des, do, eĉ, ja, jen, ju, ĵus, kaj, ke, la, mem, ol, plej, pli, plu, plus, se, sed, tre, tro, tuj

Tiujn suprajn erojn de teksto ni nomas neŭtr(al)aj vortoj, kaj ilia ripetiĝado montras ion ankaŭ pri la lingvorego de la verkanto, do ilia meznombro de ripetado enhavas ankaŭ subjektivan, individuan karakterizon sendependan de la analizanto. Sed ni vidu konkretan ekzemplon:

Helpe de iu interreta tekstoanalizilo en kelkaj sekundoj oni povas prikalkuli la necesajn statistikajn ciferojn. Sube mi listigas la datenojn ricevitajn en la kazo de la analizata provartikolo.

Nombro de la karakteroj (sen spacoj): 4720
Nombro de la frazoj: 46

Nombro de la vortoj (N - en la 1a formulo): 933
Sumo de la neŭtr(al)aj vortoj en la teksto - (n1+n2+…+n25 - en la 1a formulo): 292
Nombro de la neŭtr(al)aj vortoj sen ripetoj (i - en la 1a formulo): 25

Seninformaj kvalifikaĵoj, ne neŭtr(al)aj eroj de la teksto (
K - 2a formulo): 26

Prikalkulo de la ideala ripetado de neŭtr(al)aj vortoj ĉe iu artikolo:

B - La meznombro de vorto-ripetado
N - Nombro de ĉiuj vortoj de la teksto
n - Analizitaj neŭtr(al)aj vortoj
i - Nombro de la neŭtr(al)aj vortoj en la teksto sen ripetoj

En nia analizata provartikolo la meznombro de la ideala vorto-ripetado (de neŭtralaj teksteroj) estas 79,88 –> 80. Do, en la artikolo havante 933 vortojn ĉiu 80a statistike estas tute neŭtrala.

Manipulmontra cifero:


M - Manipulmontra cifero
K - Seninformaj kvalifikaĵoj, ne neŭtr(al)aj eroj de la teksto

La demando estas, kiel rilatas la nombro de manipulantaj teksteroj al tiu de la statistike tute neŭtralaj vortoj? La absoluta manipulmontra cifero de nia analizata artikolo estas (26 x 100/80=) 32,5 procentoj. Sed en ĉiutagoj, se iu artikolo enhavas pli ol 50-procente misinformojn, tiu ne indas eĉ je la tralego; La Manipulanto tial konsideras ke ĉiu publikigita artikolo devas havi verajn, ĝustajn informojn almenaŭ duone, tial la absolutan manipulmontran ciferon endas duobligi, do la manipulanta cifero de la provartikolo iĝas 65 procentoj.

La Manipulanto
baldaŭ interrete

Notoj:
- Tiun ĉi metodon de analizo oni prefere uzu en la kazo de artikoloj/tekstoj, kiuj havas minimume 800-1000 karakterojn.
- La metodo estis testita ankaŭ en la franca kaj rumana lingvoj (kiuj lingvoj same havas prepoziciojn).
- Kiam mi uzas la esprimon ‘informo’, fakte mi parolas pri t.n. presinformo (laŭ la ‘5W+1′-regulo: kun kiu, kie, kiam, kio kaj kiel + kial okazis) .
- Ĉi-tiu metodo estas plie empiria, ol scienca.
- Mi ankaŭ kontraŭprovis la metodon: la formuloj funkcias kaj se ĉiu vorto estas iu neŭtr(al)a prepozicio (ekzemple ‘pri’), kaj se ĉiu vorto estas kvalifikaĵo (ekzemple ’stulta’).

Published at 11:23 / 12 comments / 956 visits
This post is public

( 1 post )

 

Català | Čeština nové | 中文 | Deutsch | English | Español | Esperanto | Ελληνικά | Français | Galego | Italiano | Nederlands | Português | More...