Coleman–Liau index

Coleman–Liau index je metoda používaná k měření čitelnosti textu. Tento index byl vyvinut Meri Coleman a T. L. Liauem v roce 1975.
3 min. čtení | 598 slov

Coleman–Liau index je metoda používaná k měření čitelnosti textu. Tento index byl vyvinut Meri Coleman a T. L. Liauem v roce 1975.

Interpretace výsledků

Coleman–Liau index je číselný indikátor čitelnosti textu, který odhaduje ročník vzdělání (dle amerického školství) potřebný k jeho pochopení. Výsledek indexu tedy odpovídá americkému školnímu stupni. Například skóre 8 znamená, že text by měl být srozumitelný pro průměrného studenta 8. třídy (přibližně 13-14 let). Obecně platí:

  • Skóre 1-6: Velmi snadné čtení
  • Skóre 7-10: Přiměřené pro většinu dospělých čtenářů
  • Skóre 11-14: Poměrně obtížné čtení
  • Skóre 15+: Velmi obtížné, odborné texty

Srovnání s jinými testy čitelnosti

Na rozdíl od jiných čitelnostních testů, jako je Flesch-Kincaid nebo Gunning Fog Index, Coleman–Liau index používá počet písmen namísto počtu slabik, aby zhodnotil složitost textu. To ho činí jednodušším pro automatizované zpracování, protože počítání znaků je pro počítače snazší než identifikace slabik.

Tento index se často používá v oblasti vzdělávání, žurnalistiky a v různých oblastech, kde je důležité zajistit, aby byl text srozumitelný pro cílové publikum.

Využití v praxi

  • Vzdělávání: Pomáhá učitelům vybírat vhodné texty pro studenty různých úrovní.
  • Žurnalistika: Novináři používají index k zajištění srozumitelnosti článků pro širokou veřejnost.
  • Technické psaní: Pomáhá autorům manuálů a dokumentací udržet text přístupný.
  • Marketingové materiály: Zajišťuje, že reklamní texty jsou snadno pochopitelné pro cílovou skupinu.

Omezení tohoto testu

  • Nezohledňuje obsah nebo kontext textu.
  • Může být méně přesný pro velmi krátké texty.
  • Nehodnotí složitost myšlenek nebo argumentů v textu.
  • Kulturní a jazykové rozdíly. Index byl vyvinut primárně pro anglický jazyk. Při použití v jiných jazycích může být potřeba upravit interpretaci výsledků nebo samotný vzorec.

Hlavní charakteristiky Coleman–Liau indexu (shrnutí)

  1. Měří obtížnost textu na základě průměrné délky slov a vět.
  2. Výsledek udává přibližný americký školní stupeň potřebný k porozumění textu.
  3. Vzorec pro výpočet Coleman–Liau indexu je následující:
CLI = 0.0588 * L − 0.296 * S − 15.8

kde:

  • L je průměrný počet písmen na 100 slov,
  • S je průměrný počet vět na 100 slov.

Postup výpočtu

  1. Spočítejte počet písmen: Sečtěte všechna písmena v textu.
  2. Spočítejte počet slov: Sečtěte všechna slova v textu.
  3. Spočítejte počet vět: Sečtěte všechny věty v textu.
  4. Vypočítejte průměrný počet písmen na 100 slov: L=(počet písmen počet / slov)×100
  5. Vypočítejte průměrný počet vět na 100 slov: S=(počet vět / počet slov)×100
  6. Aplikujte vzorec: CLI=0.0588L−0.296S−15.8

Výsledek je odhadovaný ročník vzdělání potřebný k pochopení textu. Například hodnota 10 znamená, že text by měl být srozumitelný pro žáka 10. ročníku.

Příklad výpočtu v Pythonu

Zde je ukázka, jak se dá vypočítat Coleman–Liau index v Pythonu:

def coleman_liau_index(text):
    import re

    # Počet vět (rozděleno podle koncových teček, otazníků a vykřičníků…)
    sentences = len(re.findall(r'[.!?…]', text))

    # Počet písmen
    # Odstraníme interpunkci, čísla a mezery
    letters = re.sub(r'\s|[.,;:!?"„“–…()0-9]', '', text)  
    letters = len(text)

    # Počet slov (rozděleno podle mezer)
    words = len(text.split())

    # Výpočet L a S
    L = (letters / words) * 100
    S = (sentences / words) * 100

    # Coleman-Liau index
    CLI = 0.0588 * L - 0.296 * S - 15.8

    print('vět:', sentences)
    print('slov:', words)
    print('písmen:', letters)

    return CLI

# Testovací text
text = "Testovací text: Jsem posedlý touhou podvádět svou ženu. A ač hluboko ve svém nitru vím, že zahýbat není správné, něco, co je ve mně ještě hlouběji, mne ovládá. A o tom vypráví tento příběh."
cli = coleman_liau_index(text)
print(f"Coleman-Liau index: {cli:.2f}")
print(f"Text je vhodný pro čtenáře na úrovni {round(cli)}. třídy.")

Tento skript načte text, spočítá počet písmen, slov a vět a poté použije vzorec Coleman–Liau indexu k výpočtu výsledku.

Závěr

Podle mého názoru tento vzorec (přinejmenším) pro české texty ale příliš nefunguje. Respektive nemá příliš velikou vypovídací hodnotu a z praktického hlediska není příliš použitelný.

Text: sai (14. 06. 2024)
Online od 14. 06. 2024