§
    ²f j?0  ã                   ót  — U d Z ddlZddlZddlZddlZddlZddlZddlm	Z	m
Z
  ej        d¦  «        j        Z ej        d¦  «        j        ZdZi Zeeef         ed<    e	j        ¦   «         D ]+Z eej        ¦  «        dk    rej        d         eej        <   Œ,d	ed
eeeef         eeef         f         fd„Zej        d
eeeef         eeef         f         fd„¦   «         Zd
eeef         fd„Z deeef         d
eee!eedz  eef                  f         fd„Z"ej        d
eee!eedz  eef                  f         fd„¦   «         Z#ded
edz  fd„Z$ded
e%fd„Z&d
eeef         fd„Z'ej        d
e(fd„¦   «         Z) G d„ d¦  «        Z*	 dde*de(ez  ded
efd„Z+	 dd	edede*dz  d
eeedz  f         fd„Z,dS ) zÒModel loading and bigram scoring utilities.

Note: ``from __future__ import annotations`` is intentionally omitted because
this module is compiled with mypyc, which does not support PEP 563 string
annotations.
é    N)ÚREGISTRYÚlookup_encodingz>Iz>ds   CMD2Ú_SINGLE_LANG_MAPé   ÚdataÚreturnc                 óÔ  — 	 | dd…         t           k    rd}t          |¦  «        ‚d}t          | |¦  «        \  }|dz  }|dk    rd|› d}t          |¦  «        ‚g }i }t          |¦  «        D ]Š}t          | |¦  «        \  }|dz  }|dk    rd|› d	}t          |¦  «        ‚| |||z   …                              d
¦  «        }||z  }t          | |¦  «        \  }	|dz  }|                     |¦  «         |	||<   Œ‹t          j        | |d…         ¦  «        }
|dz  }t          |
¦  «        |k    r$dt          |
¦  «        › d|› }t          |¦  «        ‚t          |
¦  «        }i }t          |¦  «        D ]\  }}|dz  }|||dz   …         ||<   ŒnZ# t          j        $ r}d|› }t          |¦  «        |‚d}~wt          j        t          f$ r}d|› }t          |¦  «        |‚d}~ww xY w||fS )záParse the v2 dense zlib-compressed models.bin format.

    :param data: Raw bytes of models.bin (must be non-empty).
    :returns: A ``(models, norms)`` tuple.
    :raises ValueError: If the data is corrupt or truncated.
    Né   z&corrupt models.bin: missing CMD2 magici'  zcorrupt models.bin: num_models=z exceeds limité   zcorrupt models.bin: name_len=z exceeds 256zutf-8é   é   z&corrupt models.bin: decompressed size z != expected zcorrupt models.bin: )Ú	_V2_MAGICÚ
ValueErrorÚ_unpack_uint32ÚrangeÚdecodeÚ_unpack_float64ÚappendÚzlibÚ
decompressÚlenÚ
memoryviewÚ	enumerateÚerrorÚstructÚUnicodeDecodeError)r   ÚmsgÚoffsetÚ
num_modelsÚnamesÚnormsÚ_Úname_lenÚnameÚnormÚblobÚexpected_sizeÚmvÚmodelsÚiÚstartÚes                    úkC:\Users\Terasoftware\OneDrive\Desktop\faahhh\fyndo\fyndo\venv\Lib\site-packages\chardet/models/__init__.pyÚ_parse_models_binr.      s  € ð6%ØŒ8•yÒ ð 	"Ø:ˆCÝ˜S‘/”/Ð!àˆÝ& t¨VÑ4Ô4‰ˆØ!‰ˆà˜Òð 	"ØN°JÐNÐNÐNˆCÝ˜S‘/”/Ð!àˆØ"$ˆÝzÑ"Ô"ð 	ð 	ˆAÝ(¨¨vÑ6Ô6‰KˆXØa‰KˆFØ˜#Š~ð &ØL°hÐLÐLÐLÝ  ‘o”oÐ%Ø˜ ¨(Ñ!2Ð2Ô3×:Ò:¸7ÑCÔCˆDØhÑˆFÝ% d¨FÑ3Ô3‰GˆTØa‰KˆFØLŠL˜ÑÔÐØˆE$‰KˆKõ Œ˜t F G Gœ}Ñ-Ô-ˆØ" UÑ*ˆÝˆt‰9Œ9˜Ò%ð 	"ð/½¸T¹¼ð /ð /Ø,ð/ð /ð õ ˜S‘/”/Ð!õ ˜ÑÔˆØ(*ˆÝ  Ñ'Ô'ð 	5ð 	5‰GˆAˆtØ˜‘IˆEØ˜e e¨e¡mÐ3Ô4ˆF4‰LˆLð	5øõ Œ:ð %ð %ð %Ø( QÐ(Ð(ˆÝ˜‰oŒo 1Ð$øøøøÝŒLÕ,Ð-ð %ð %ð %Ø( QÐ(Ð(ˆÝ˜‰oŒo 1Ð$øøøøð%øøøð 5ˆ=Ðs$   ‚F	F ÆG#ÆF0Æ0G#Ç	GÇG#c                  óð   — t           j                             d¦  «                             d¦  «        } |                      ¦   «         }|s t          j        dt          d¬¦  «         i i fS t          |¦  «        S )zkLoad and parse models.bin, returning (models, norms).

    Cached: only reads from disk on first call.
    úchardet.modelsz
models.binuX   chardet models.bin is empty â€” statistical detection disabled; reinstall chardet to fixé   ©Ú
stacklevel)	Ú	importlibÚ	resourcesÚfilesÚjoinpathÚ
read_bytesÚwarningsÚwarnÚRuntimeWarningr.   ©Úrefr   s     r-   Ú_load_models_datar>   a   s}   € õ Ô
×
#Ò
#Ð$4Ñ
5Ô
5×
>Ò
>¸|Ñ
LÔ
L€CØ>Š>ÑÔ€Dàð ÝŒð'åØð		
ñ 	
ô 	
ð 	
ð 2ˆvˆå˜TÑ"Ô"Ð"ó    c                  ó*   — t          ¦   «         d         S )zòLoad all bigram models from the bundled models.bin file.

    Each model is a memoryview of length 65536 (256*256).
    Index: (b1 << 8) | b2 -> weight (0-255).

    :returns: A dict mapping model key strings to 65536-byte lookup tables.
    r   ©r>   © r?   r-   Úload_modelsrC   v   s   € õ ÑÔ˜qÔ!Ð!r?   r)   c                 ó,  — i }|                       ¦   «         D ]J\  }}|                     dd¦  «        \  }}|                     |g ¦  «                             |||f¦  «         ŒKt	          |¦  «        D ]"}t          |¦  «        }|||vr||         ||<   Œ#|S )zËBuild a grouped index from a models dict.

    :param models: Mapping of ``"lang/encoding"`` keys to 65536-byte tables.
    :returns: Mapping of encoding name to ``[(lang, model, model_key), ...]``.
    ú/r   )ÚitemsÚsplitÚ
setdefaultr   Úlistr   )r)   ÚindexÚkeyÚmodelÚlangÚencÚenc_nameÚ	canonicals           r-   Ú_build_enc_indexrQ      s·   € ð BD€EØ—l’l‘n”nð =ð =‰
ˆˆUØ—I’I˜c 1Ñ%Ô%‰	ˆˆcØ×Ò˜˜bÑ!Ô!×(Ò(¨$°°sÐ);Ñ<Ô<Ð<Ð<õ ˜‘K”Kð /ð /ˆÝ# HÑ-Ô-ˆ	Øð 	/ Y°eÐ%;ð 	/Ø$ XœˆE)Ñøà€Lr?   c                  ó8   — t          t          ¦   «         ¦  «        S )zTReturn a pre-grouped index mapping encoding name -> [(lang, model, model_key), ...].)rQ   rC   rB   r?   r-   Úget_enc_indexrS   ˜   s   € õ K™MœMÑ*Ô*Ð*r?   Úencodingc                 ó6   — t                                | ¦  «        S )zÕReturn the language for a single-language encoding, or None.

    :param encoding: The canonical encoding name.
    :returns: An ISO 639-1 language code, or ``None`` if the encoding is
        multi-language.
    )r   Úget©rT   s    r-   Úinfer_languagerX   ž   s   € õ ×Ò Ñ)Ô)Ð)r?   c                 ó"   — | t          ¦   «         v S )z¾Return True if the encoding has language variants in the model index.

    :param encoding: The canonical encoding name.
    :returns: ``True`` if bigram models exist for this encoding.
    )rS   rW   s    r-   Úhas_model_variantsrZ   ¨   s   € ð •}‘”Ð&Ð&r?   c                  ó*   — t          ¦   «         d         S )zAReturn cached L2 norms for all models, keyed by model key string.r   rA   rB   r?   r-   Ú_get_model_normsr\   ±   s   € åÑÔ˜qÔ!Ð!r?   c                  óP  — t           j                             d¦  «                             d¦  «        } |                      ¦   «         }t          |¦  «        dk    r?t          j        dt          |¦  «        › dt          d¬¦  «         t          ddz  ¦  «        S t          |¦  «        S )	uÎ  Return a 65536-byte IDF weight table for bigram profile construction.

    Loads a precomputed table from ``idf.bin`` (generated at training time).
    For each bigram index, the weight reflects how discriminative that bigram
    is across all models:

    - Bigrams in every model (common ASCII) â†’ weight 1 (minimal signal)
    - Bigrams in one model â†’ weight 255 (maximum signal)
    - Bigrams not in any model â†’ weight 1 (unknown, treat as neutral)
    r0   zidf.binr   z chardet idf.bin has wrong size (z"), falling back to uniform weightsr1   r2   ó   )
r4   r5   r6   r7   r8   r   r9   r:   r;   Ú	bytearrayr<   s     r-   Úget_idf_weightsr`   ¶   s¦   € õ Ô
×
#Ò
#Ð$4Ñ
5Ô
5×
>Ò
>¸yÑ
IÔ
I€CØ>Š>ÑÔ€DÝ
ˆ4y„yEÒð *ÝŒð.­s°4©y¬yð .ð .ð .åØð		
ñ 	
ô 	
ð 	
õ ˜ 5™Ñ)Ô)Ð)ÝT‰?Œ?Ðr?   c                   óV   — e Zd ZdZdZdeddfd„Zedee	e	f         dd fd„¦   «         Z
dS )	ÚBigramProfileu  Pre-computed bigram frequency distribution for a data sample.

    Computing this once and reusing it across all models reduces per-model
    scoring from O(n) to O(distinct_bigrams).

    Stores a dense ``freq`` list of length 65536 indexed by bigram index, plus
    a ``nonzero`` list of indices with non-zero frequency for fast iteration.
    Each bigram is weighted by its IDF (inverse document frequency) across all
    models â€” bigrams unique to few models get high weight, bigrams common to
    all models get weight 1.
    )ÚfreqÚ
input_normÚnonzeroÚ
weight_sumr   r   Nc                 óú  — t          |¦  «        dz
  }|dk    rg | _        g | _        d| _        d| _        dS t          ¦   «         }dgdz  }g }d}t          |¦  «        D ]W}||         dz  ||dz            z  }||         }	||         dk    r|                     |¦  «         ||xx         |	z  cc<   ||	z  }ŒX|| _        || _        || _        d}
|D ]}||         }|
||z  z  }
Œt          j	        |
¦  «        | _        dS )a?  Compute the bigram frequency distribution for *data*.

        Each bigram is weighted by its IDF (inverse document frequency) across
        all loaded models.  Bigrams unique to few models get high weight;
        bigrams common to all models get weight 1.

        :param data: The raw byte data to profile.
        r   r   ç        Nr   r   )
r   rc   re   rf   rd   r`   r   r   ÚmathÚsqrt)Úselfr   Útotal_bigramsÚidfrc   re   Úw_sumr*   ÚidxÚwÚnorm_sqÚvs               r-   Ú__init__zBigramProfile.__init__Þ   s6  € õ ˜D™	œ	 A™ˆØ˜AÒð 	ð $&ˆDŒIØ&(ˆDŒLØ#$ˆDŒOØ%(ˆDŒOØˆFåÑÔˆØ˜# ™+ˆØˆØˆÝ}Ñ%Ô%ð 	ð 	ˆAØ˜”7˜a‘< 4¨¨A©¤;Ñ.ˆCØC”ˆAØCŒy˜AŠ~ð $Ø—’˜sÑ#Ô#Ð#ØˆIˆIŒI˜‰NˆIˆI‰IØQ‰JˆEˆEØˆŒ	ØˆŒØˆŒØˆØð 	ð 	ˆCØS”	ˆAØq˜1‘uÑˆGˆGÝœ) GÑ,Ô,ˆŒˆˆr?   Úweighted_freqc                 ó„  —  | d¦  «        }dgdz  }g }|                      ¦   «         D ]!\  }}|||<   |r|                     |¦  «         Œ"||_        ||_        t	          |                     ¦   «         ¦  «        |_        t          j        t	          d„ |                     ¦   «         D ¦   «         ¦  «        ¦  «        |_	        |S )aL  Create a BigramProfile from pre-computed weighted frequencies.

        Computes ``weight_sum`` and ``input_norm`` from *weighted_freq* to
        ensure consistency between the stored fields.

        :param weighted_freq: Mapping of bigram index to weighted count.
        :returns: A new :class:`BigramProfile` instance.
        r?   r   r   c              3   ó    K  — | ]	}||z  V — Œ
d S ©NrB   )Ú.0rr   s     r-   ú	<genexpr>z3BigramProfile.from_weighted_freq.<locals>.<genexpr>  s&   è è € Ð*QÐ*Q°Q¨1¨q©5Ð*QÐ*QÐ*QÐ*QÐ*QÐ*Qr?   )
rF   r   rc   re   ÚsumÚvaluesrf   ri   rj   rd   )Úclsrt   Úprofilerc   re   ro   Úcounts          r-   Úfrom_weighted_freqz BigramProfile.from_weighted_freq  sÈ   € ð #c‘(”(ˆØ˜# ™+ˆØˆØ'×-Ò-Ñ/Ô/ð 	$ð 	$‰JˆCØˆD‰IØð $Ø—’˜sÑ#Ô#Ð#øØˆŒØ!ˆŒÝ  ×!5Ò!5Ñ!7Ô!7Ñ8Ô8ˆÔÝ!œY¥sÐ*QÐ*Q¸-×:NÒ:NÑ:PÔ:PÐ*QÑ*QÔ*QÑ'QÔ'QÑRÔRˆÔØˆr?   )Ú__name__Ú
__module__Ú__qualname__Ú__doc__Ú	__slots__Úbytesrs   ÚclassmethodÚdictÚintr   rB   r?   r-   rb   rb   Ï   s   € € € € € ð
ð 
ð @€Ið&-˜Uð &- tð &-ð &-ð &-ð &-ðP ð¨t°C¸°H¬~ð À/ð ð ð ñ „[ðð ð r?   rb   Ú r}   rL   Ú	model_keyc                 óZ  — | j         dk    rdS t          ¦   «         }|r|                     |¦  «        nd}|€:d}t          d¦  «        D ]}||         }|r|||z  z  }Œt	          j        |¦  «        }|dk    rdS d}| j        }	| j        D ]}
|||
         |	|
         z  z  }Œ||| j         z  z  S )zSScore a pre-computed bigram profile against a single model using cosine similarity.rh   Nr   r   )rd   r\   rV   r   ri   rj   rc   re   )r}   rL   rŠ   r!   Ú
model_normÚsq_sumr*   rr   Údotrc   ro   s              r-   Úscore_with_profiler     sê   € ð Ô˜SÒ ð ØˆsÝÑÔ€EØ)2Ð<—’˜9Ñ%Ô%Ð%¸€JØð 'ØˆÝu‘”ð 	 ð 	 ˆAØa”ˆAØð  Ø˜!˜a™%‘øÝ”Y˜vÑ&Ô&ˆ
ØSÒð ØˆsØ
€CØŒ<€DØŒð &ð &ˆØˆuSŒz˜D œIÑ%Ñ%ˆˆØ*˜wÔ1Ñ1Ñ2Ð2r?   c                 óÖ   — | s|€dS t          ¦   «         }|                     |¦  «        }|€dS |€t          | ¦  «        }d}d}|D ]!\  }}}	t          |||	¦  «        }
|
|k    r|
}|}Œ"||fS )a  Score data against all language variants of an encoding.

    Returns (best_score, best_language). Uses a pre-grouped index for O(L)
    lookup where L is the number of language variants for the encoding.

    If *profile* is provided, it is reused instead of recomputing the bigram
    frequency distribution from *data*.

    :param data: The raw byte data to score.
    :param encoding: The canonical encoding name to match against.
    :param profile: Optional pre-computed :class:`BigramProfile` to reuse.
    :returns: A ``(score, language)`` tuple with the best cosine-similarity
        score and the corresponding language code (or ``None``).
    N)rh   Nrh   )rS   rV   rb   r   )r   rT   r}   rJ   ÚvariantsÚ
best_scoreÚ	best_langrM   rL   rŠ   Úss              r-   Úscore_best_languager•   6  s§   € ð& ð Gð Øˆyå‰OŒO€EØyŠy˜Ñ"Ô"€HØð Øˆyàð &Ý Ñ%Ô%ˆà€JØ €IØ"*ð ð ÑˆˆeYÝ˜w¨¨yÑ9Ô9ˆØˆzŠ>ð 	ØˆJØˆIøàyÐ Ð r?   )r‰   rw   )-rƒ   Ú	functoolsÚimportlib.resourcesr4   ri   r   r9   r   Úchardet.registryr   r   ÚStructÚunpack_fromr   r   r   r   r‡   ÚstrÚ__annotations__r{   Ú_encr   Ú	languagesr$   r…   Útupler   Úfloatr.   Úcacher>   rC   rI   rQ   rS   rX   ÚboolrZ   r\   r_   r`   rb   r   r•   rB   r?   r-   ú<module>r£      s§  ððð ð ð Ð Ð Ð Ø Ð Ð Ð Ø €€€Ø €€€Ø €€€Ø €€€à 6Ð 6Ð 6Ð 6Ð 6Ð 6Ð 6Ð 6à”˜tÑ$Ô$Ô0€Ø&”- Ñ%Ô%Ô1€Ø€	ð $&Ð $s˜Cx”.Ð %Ð %Ñ %ØˆHŒOÑÔð 8ð 8€DØ
€sˆ4Œ>ÑÔ˜aÒð 8Ø&*¤n°QÔ&7Ð˜œÑ#øðAØ
ðAà
ˆ4ZÔ  $ s¨E zÔ"2Ð2Ô3ðAð Að Að AðH „ð#˜5  c¨: oÔ!6¸¸SÀ%¸ZÔ8HÐ!HÔIð #ð #ð #ñ „ð#ð("T˜#˜z˜/Ô*ð "ð "ð "ð "ðØjÔ!ðà	ˆ#ˆtE˜# ™* j°#Ð5Ô6Ô7Ð
7Ô8ðð ð ð ð. „ð+t˜C  e¨C°$©J¸
ÀCÐ,GÔ&HÔ!IÐIÔJð +ð +ð +ñ „ð+ð
*˜Sð * S¨4¡Zð *ð *ð *ð *ð' ð '¨ð 'ð 'ð 'ð 'ð"˜$˜s E˜zÔ*ð "ð "ð "ð "ð
 „ð˜ð ð ð ñ „ðð0Lð Lð Lð Lð Lñ Lô Lð Lð` MOð3ð 3Øð3Ø#,¨zÑ#9ð3ØFIð3à
ð3ð 3ð 3ð 3ð6 %)ð&!ð &!Ø
ð&!àð&!ð ˜TÑ!ð&!ð ˆ5#˜‘*ÐÔð	&!ð &!ð &!ð &!ð &!ð &!r?   