entrée et de sortie pour les programmes peut venir dans une variété de formats , selon les besoins de l'application . Les programmeurs peuvent utiliser une représentation de bas niveau des données dans l'octet , qui représente les données sous zéros et de uns . Si vous traitez avec du texte , les programmeurs peuvent utiliser l'entrée de caractère codé. Comme toutes les données se compose de bits , et donc octets, traitant avec des octets plutôt que des caractères peut donner aux programmeurs un accès à une forme plus «pure» ou transparent de données pour travailler avec. Bytes
octets représentent une forme de base de données informatiques . Composé de huit bits , un octet est souvent utilisé pour représenter une forme particulière de données. Octets eux-mêmes sont souvent utilisés comme une forme sous-jacente «neutre» de l'information qui est un peu comme l'information représentée par le langage machine de l'ordinateur. En tant que tel , les octets servent une variété de raisons, selon le contexte et la manière dont elles sont traduites.
Caractères
Caractères dans les langages de programmation sont des lettres , des chiffres et marques ponctuant tels que les espaces et la ponctuation. Alors qu'ils sont un type de données scalaire , ce qui signifie qu'ils ne peuvent pas être réduites à un type de données plus fondamental , les personnages sont composés d'une représentation binaire . Chaque personnage dans un schéma de codage est constitué de bits , généralement un octet. Saisie de caractères et de sortie (I /O) implique généralement une traduction entre l'utilisateur et le langage machine sous-jacente de l'ordinateur.
Codage des caractères
différent humaine langues nécessitent différentes représentations d'octets afin d' afficher des caractères . Un système de codage simple, ASCII , mappe une représentation simple de caractères sur une valeur à huit bits . Cela crée un maximum de 255 caractères dans le schéma de codage ASCII. ASCII fonctionne de manière fiable pour la langue anglaise , mais d'autres langues qui requièrent des lettres ou des caractères spéciaux nécessitent différents schémas de codage , qui nécessitent de grandes valeurs d'octets ou de relations octet caractères remappées .
Octet E /S et de caractère , je /O
En termes de codage de caractères , les deux variétés de I /O représentent différents formats pour différents usages. Orienté octet I /O est une utilisation plus neutre , ce qui signifie octets peuvent se conformer à de nombreuses applications différentes . Beaucoup de concepteurs de programmes utilisent octet flux d'E /S pour faire face à des représentations non codés de médias tels que des fichiers texte à des fins telles que le cryptage ou la traduction. Caractère I /O représente octets qui ont déjà subi l'encodage, et en tant que tel peut ne pas correspondre à des applications spécifiques . Un flux de caractères en utilisant le codage ASCII ne peut pas lire les octets d'un fichier de la même manière qu'un flux de caractères à la recherche de texte UTF -32- codé.