Caractaran: còdaichean agus sgrìobhadh a-steach

Aig deireadh a’ mhodail bu chòir do na h-oileanaich a bhith comasach air:

  1. Sealltainn gu bheil iad eòlach air Unicode, air UTF-8 (agus encodings eile) agus air na diofar dhòighean air carachtaran le sràc agus carachtaran annasach a sgrìobhadh a-steach air diofar choimpiutairean.

Còdaichean: Bu chòir dhut a bhith eòlach air:

Bits agus bytes. Binary.

ASCII (ISO 646; “US-ASCII”). Control characters. Capitals agus lower case. Dé nach eil ann (m.e. £ ¢ € ‘ ’ “ ”).

ISO 8859-1 (Latin-1). Òrdugh nan caractaran. Capitals agus lower case. Dé nach eil ann (m.e. € ‘ ’ “ ”). Sgrìobhadh charactaran le Alt+meurchlàr àireamhach ann an Windows. Windows-1252.

ISO 8859. Na pàirtean eile, gu h-àraid ISO 8859-2 ... ISO 8859-8. Dé nach eil annta (m.e. ŵ ŷ anns na pàirtean 1-4). ISO 8859-14 (Celtic), ged nach eil sin cudromach a-nis (agus cha robh riamh oir bha Unicode a’ tighinn a-steach nuair a chaidh a chruthachadh).

Unicode. Graphemes agus glyphs. Han unification. Am Basic Multilingual Plane agus na blocks. An dòigh sgrìobhaidh U+nnnn. UTF-16. Am BOM (U+FEFF).

Combining characters. Caractaran precomposed agus decomposed. Unicode equivalence agus normal forms.

UTF-8.

Cleasan airson riochdachadh le ASCII - diofar riaghailtean airson caractaran nach eil ann an ASCII a riochdachadh le caractaran ASCII.

Ceanglaichean feumail a thaobh Unicode

Ceanglaichean feumail a thaobh sgrìobhadh charactaran

Ceanglaichean feumail a thaobh cur an òrdugh (collation)

2023-01-06 CPD