Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Avertissement Consulter la version la plus récente.

Contenu archivé

L'information indiquée comme étant archivée est fournie aux fins de référence, de recherche ou de tenue de documents. Elle n'est pas assujettie aux normes Web du gouvernement du Canada et elle n'a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Normes et lignes directrices relatives à la confidentialité et à la qualité des données (version publique) : Pratiques relatives à la qualité des données

La section ci-après décrit les méthodes utilisées pour restreindre la diffusion de données du recensement de qualité inacceptable.

Suppression de régions dans les tableaux comportant des données sur le revenu

Lorsqu’elle est appliquée pour des raisons liées à la qualité des données, la règle de suppression des régions consiste à remplacer les données sur les caractéristiques du revenu par des zéros dans le cas des régions géographiques dont la population ou le nombre de ménages est inférieur à un seuil déterminé.

Lorsqu’un tableau du recensement comporte des données sur les caractéristiques du revenu des particuliers, des familles ou des ménages, la règle qui suit s’applique. Les données sur les caractéristiques du revenu sont remplacées par des zéros pour les régions comptant moins de 250 habitants ou moins de 40 ménages privés. Ces seuils sont appliqués aux données du Recensement de 2006 et à celles de tous les recensements antérieurs. Le seuil de 40 ménages privés s’explique du fait que l’on utilise des données pondérées. Étant donné que le facteur de pondération de chaque ménage est de 5, l’établissement d’un seuil de 40 permet d’assurer qu’au moins 8 ménages seront utilisés aux fins du calcul. Le seuil relatif aux ménages privés ne s’applique pas dans les tableaux portant sur des régions géographiques du lieu de travail.

Mesures de la qualité des données

Indicateurs de la qualité des données relatifs aux totalisations selon les géographies du lieu de résidence

Des indicateurs de la qualité des données sont liés à toutes les régions géographiques normalisées sur lesquelles des données sont diffusées. Dans les bases de données du recensement, les indicateurs de la qualité des données consistent en une zone numérique de cinq octets. Sur la base de données et dans les produits électroniques parcourus à l'aide de Beyond 20/20, ces indicateurs sont affichés en utilisant un code numérique à cinq chiffres (exemple : 0 2 1 3 1). Dans le site Internet du recensement et les produits imprimés, les utilisateurs peuvent reconnaître les régions partiellement dénombrées à l'aide de symboles. Les signes conventionnels utilisés pour les produits du Recensement de 2006 seront expliqués dans les normes régissant les publications.

Régions incomplètement dénombrées

Lors du Recensement de 2006 et des recensements antérieurs, certaines aires de diffusion dans les réserves indiennes n’ont pas été dénombrées parce que leur population a refusé de participer ou de collaborer au recensement. Conformément aux règles relatives à la qualité des données, il faut repérer et supprimer dans les produits les régions non dénombrées, et signaler les régions géographiques de niveau supérieur qui comprennent des secteurs non dénombrés.

Même si aucune donnée du recensement n’a été recueillie pour les secteurs de non-réponse, les secteurs eux-mêmes sont inclus dans les hiérarchies des unités géographiques normalisées figurant dans les bases de données du recensement. Les logiciels d’extraction et de totalisation peuvent extraire ces régions qui ne comportent aucune donnée correspondante.

Régions partiellement dénombrées

Toutes les régions géographiques qui renferment un secteur incomplètement dénombré sont considérées comme étant des régions partiellement dénombrées. On signale aux utilisateurs à l’aide d’un indicateur que ces régions contiennent des secteurs incomplètement dénombrés.

Taux de réponse globaux (Indicateur relatif à la qualité des données intégrales [100 %] et Indicateur relatif à la qualité des données-échantillon [20 %])

On détermine les taux de réponse globaux pour chacune des régions géographiques du recensement. Ces régions sont indiquées dans la base de données selon le taux de non-réponse. Les régions qui présentent un taux de non-réponse égal ou supérieur à 25 % sont supprimées des totalisations. Les régions qui présentent un taux de non-réponse égal ou supérieur à 5 % mais inférieur à 25 % ont été regroupées en 2 catégories et sont marquées d’un indicateur distinct selon que le taux de non-réponse se situe entre 5 % et 10 % ou entre 10 % et 25 %. Ces régions géographiques ne sont pas supprimées, mais sont marquées d’un indicateur dans les totalisations.

Indicateur d'erreur dans les chiffres de population et des logements

À la suite à une diffusion des chiffres de population et des logements, des erreurs sont occasionnellement relevées dans les données. Il est impossible d'apporter des changements aux données présentées du Recensement de 2006 ou de 2001. Toutefois, les utilisateurs peuvent obtenir les modifications aux chiffres de population et des logements touchant les subdivisions de recensement et d'autres niveaux géographiques en consultant la section consacrée au Recensement de 2006 ou de 2001 dans le site Web de Statistique Canada.

Indicateur d’ajustement du chiffre de population de 2001

Les utilisateurs qui souhaitent comparer les données du Recensement de 2006 avec celles des recensements antérieurs doivent tenir compte des modifications qui peuvent être apportées aux limites des régions géographiques d’un recensement à un autre. Afin de faciliter les comparaisons, les chiffres du Recensement de 2001 ont été ajustés au besoin en fonction des modifications apportées aux limites entre 2001 et 2006. Les chiffres de 2001 qui ont été corrigés ainsi que les régions créées depuis 2001, telles que les nouvelles municipalités constituées (subdivisions de recensement) et les nouvelles localités désignées, sont eux aussi marqués d’un indicateur. La plupart de ces indicateurs ont toutefois pour objet de signaler des modifications de limites.

Le tableau ci-après décrit la zone d’indicateur de la qualité des données et son contenu. Prenez note qu’un zéro dans l’un ou l’autre des cinq octets est la valeur implicite pour l’indicateur correspondant et signifie qu’aucune mesure relative à la qualité des données n’est requise.

Indicateurs de la qualité des données pour le lieu de résidence - Recensement de 2006
Caractère numérique Description Valeur de l'octet Description des indicateurs
1er (0XXXX) Indicateur de dénombrement partiel 0 Valeur implicite.
1 Réserve indienne ou établissement indien partiellement dénombré (supprimées).
2 Ne comprend pas les données du recensement pour une ou plusieurs réserves indiennes ou établissements indiens partiellement dénombrés.
2e (X0XXX) Indicateur relatif à la qualité des données intégrales (100 %) 0 Valeur implicite.
1 Indice de la qualité des données indiquant, pour le questionnaire de recensement abrégé (données intégrales [100 %]), un taux global de non-réponse supérieur ou égal à 5 %, mais inférieur à 10 %.
2 Indice de la qualité des données indiquant, pour le questionnaire de recensement abrégé (données intégrales [100 %]), un taux global de non-réponse supérieur ou égal à 10 %, mais inférieur à 25 %.
3 Indice de la qualité des données indiquant, pour le questionnaire de recensement abrégé (données intégrales [100 %]), un taux global de non-réponse supérieur ou égal à 25 % (supprimées).
3e (XX0XX) Indicateur d'erreur dans les chiffres de population et des logements 0 Valeur implicite.
1 Il y a une erreur dans les chiffres de population et des logements de 2006 pour cette région. Pour obtenir de plus amples renseignements, veuillez consulter la section des données sur les chiffres de population et des logements du fichier « Notes ».
2 En 2001, les chiffres de population et/ou des logements sont erronés pour cette subdivision de recensement. Étant donné qu'il n'est pas possible d'apporter des changements aux données de 2001 présentées dans ces tableaux, les données de 2001 doivent être utilisées avec prudence. Pour obtenir de plus amples renseignements, veuillez consulter la section des données sur les chiffres de population et des logements du fichier « Notes ».
3 Les chiffres de population et/ou des logements de 2006 et de 2001 pour cette région sont erronés. Étant donné qu'il n'est pas possible d'apporter des changements aux données du recensement présentées dans ces tableaux, ces données doivent être utilisées avec prudence. Pour obtenir de plus amples renseignements, veuillez consulter la section des données sur les chiffres de population et des logements du fichier « Notes ».
4e (XXX0X) Indicateur relatif à la qualité des données-échantillon (20 %) 0 Valeur implicite.
1 Indice de la qualité des données indiquant, pour le questionnaire de recensement complet (données-échantillon [20 %]), un taux global de non-réponse supérieur ou égal à 5 %, mais inférieur à 10 %.
2 Indice de la qualité des données indiquant, pour le questionnaire de recensement complet (données-échantillon [20 %]), un taux global de non-réponse supérieur ou égal à 10 %, mais inférieur à 25 %.
3 Indice de la qualité des données indiquant, pour le questionnaire de recensement complet (données-échantillon [20 %]), un taux global de non-réponse supérieur ou égal à 25 % (supprimées).
5e (XXXX0) Indicateur de rajustement des chiffres de population de 2001 0 Valeur implicite.
1 Chiffre de 2001 rajusté; la plupart de ces rajustements sont le résultat de modifications des limites.

Nota : Les indicateurs de la qualité des données intégrales (100%) et des données-échantillon (20%) ne s’appliquent pas aux chiffres de population et des logements. Un tableau des indicateurs de la qualité des données pour les années de recensement antérieures à 2001 se trouve à la fin de ce document en annexe B.

Indicateurs de la qualité des données relatifs aux totalisations selon les géographies du lieu de travail

Pour des raisons de qualité des données, les régions relatives au lieu de travail sont supprimées lorsque les trois conditions suivantes sont réunies :

  1. la région n'est pas encore supprimée pour des raisons de confidentialité;
  2. la région de résidence équivalente est supprimée pour des raisons de qualité des données;
  3. la plupart des travailleurs de la région sont également des résidents de la région.

L'indicateur de la qualité des données pour le lieu de travail utilise seulement le 4e chiffre du code numérique à cinq chiffres. Une valeur de 3 sur cet indicateur relatif à la géographie du lieu de travail indique que la région doit être supprimée.

Indicateur de la qualité des données pour le lieu de travail - Recensement de 2006
Caractère numérique Description Valeur de l’octet Description des indicateurs
4e (XXX0X) Indicateur relatif à la qualité des données-échantillon (20%) 0 Valeur implicite.
3
  • indice de la qualité des données pour le questionnaire complet du recensement (données-échantillon [20 %]);
  • un taux global de non-réponse supérieur ou égal à 25 % (supprimé); et
  • la majorité de la population active occupée qui travaille dans la région réside également dans la même région.

Autres méthodes de suppression relative à la qualité des données

Les méthodes de suppression mentionnées jusqu’à maintenant sont suffisantes pour supprimer les régions pour lesquelles la qualité des données est inacceptable et pour signaler les données de qualité inférieure dans la plupart des produits de données du recensement. Toutefois, le secteur qui établit les spécifications ou le secteur chargé de la production peut demander que des règles de suppression additionnelles en raison de la qualité des données soient appliquées pour certains produits : par exemple, en augmentant les seuils de population appliqués ou en supprimant des répartitions ou des cellules. Il s’agit de règles de suppression qui s’appliquent à des produits en particulier; elles ne font donc pas partie des systèmes de suppression automatisés. Dans tous les cas, il est nécessaire d’utiliser un processus manuel.

Suppression de répartitions

La suppression de répartitions constitue l’exemple le plus fréquent d’autres méthodes de suppression visant à garantir la qualité des données. Cette méthode de suppression est utilisée dans certains produits normalisés sur le revenu, lorsque le nombre total d’unités (personnes, familles, ménages) dans la répartition des revenus est inférieur à 250. Une variante de cette méthode est appliquée aux produits normalisés qui renferment des statistiques sur le nombre et la moyenne du revenu d’emploi ou du revenu total seulement.

De plus, lorsqu'il y a des indices d'un taux élevé de variabilité parmi les réponses et, par conséquent, la possibilité de valeurs extrêmes de revenu, les statistiques sur les gains et/ou le revenu peuvent également être supprimées pour les besoins de la qualité des données. Ainsi, des règles spécifiques plus nombreuses sont en vigueur, tenant compte non seulement de la taille de la population, mais également de l'incertitude probable des estimations en raison des valeurs extrêmes et de la variabilité d'échantillonnage.

Calcul des statistiques d’ordre

Les médianes et, de façon plus générale, les quantiles sont calculés au moyen d’interpolations linéaires. L’intervalle de quantile (c’est-à-dire l’intervalle dans lequel figure la valeur du quantile) est déterminé au moyen de deux méthodes fondées sur le genre des valeurs attribuées aux variables statistiques :

  1. Variables dont les valeurs peuvent comporter des décimales et variables dont les valeurs sont exprimées en dollars

    L’intervalle de quantile est construit de façon que les erreurs relatives découlant de l’utilisation d’une interpolation linéaire soient inférieures à 0,78 %. Par exemple, si le quantile réel est 30 000 $, l’erreur imputable à l’utilisation de l’algorithme intégré doit être inférieure à 234 $.

  2. Variables dont les valeurs sont des nombres entiers non exprimés sous forme de dollars.

    Pour ces variables, l’intervalle de quantile correspond toujours à une unité (1). Par exemple, si le quantile réel est 23,46, l’interpolation est appliquée à l’intervalle [23, 24].

  Page précédente | Notes | Page suivante