Resumen Antecedentes
línea de base y datos de tendencia de la incidencia oral y cáncer faríngeo es limitado. Un nuevo algoritmo se obtuvo utilizando la Vigilancia, Epidemiología y Resultados Finales (SEER) -Medicare vincula la base de datos para crear un algoritmo para identificar los casos incidentes de cáncer bucal y faríngeo utilizando las reclamaciones de Medicare.
Métodos
Usando una muestra dividida enfoque, las reclamaciones de Medicare 'códigos de procedimiento y diagnóstico se utilizaron para generar un nuevo algoritmo para identificar los casos de cáncer oral y faríngea y validar sus características de funcionamiento.
resultados
El algoritmo tenían una alta sensibilidad (95%) y especificidad (97% ), que varió poco por grupo de edad, sexo y raza y el origen étnico.
Conclusión
ejemplos de la utilidad de este algoritmo y sus características de funcionamiento que incluyen el uso de derivar la línea de base y de tendencia estimaciones de la incidencia del cáncer oral y faríngea. Estas medidas podrían ser utilizados para proporcionar estimaciones de incidencia donde sea insuficiente o para servir como estimaciones de comparación para el registro de tumores.
Palabras clave
Medicare El cáncer oral análisis secundario de datos SEER material complementario Electrónico
La versión en línea de este artículo ( doi:. 10 1186 /1472-6831-13-1) contiene material complementario, que está disponible para los usuarios autorizados
Antecedentes
El informe del Cirujano general sobre la salud oral en América indicó que las bases de datos de vigilancia orales y craneofaciales. para las enfermedades, servicios de salud y utilización de servicios sanitarios son limitados, o en ausencia [1]. Este informe llamado para un mayor desarrollo y la validación de las medidas de resultado [1]. El Instituto Nacional de Investigación Dental y Craneofacial (NIDCR) tomó nota de las preocupaciones similares [2], y describió la necesidad de datos de referencia con el fin de reconocer tendencias en el tiempo, sobre todo para las poblaciones marginadas y condiciones menos comunes entre la población general [2].
oral y faríngeo (OP) cánceres se diagnostican en cerca de 30.000 personas en los Estados Unidos cada año, y la mortalidad anual por cáncer de OP es de aproximadamente 7.500 [1-3]. Una gran parte de los casos diagnosticados de OP se encuentran entre las personas mayores de 65 años y mayores [4]. A pesar del gran número de casos nuevos cada año, el cáncer de OP-hablando en términos relativos, es una enfermedad rara; por lo que grandes ajustes basados en la población a menudo se requieren para responder a importantes preguntas de investigación. Por lo tanto, hemos generado y validado un algoritmo para identificar los casos de incidencia OP en base a las reclamaciones de Medicare.
Afirma investigadores han utilizado Medicare por cáncer y otros estudios de resultados de salud. Hospitales, ambulatorios, y el médico reclamaciones pueden ser reconfigurados en bases de datos longitudinales. Estos pueden incluir los códigos de diagnóstico y procedimiento, el costo de los servicios prestados, así como las fechas correspondientes de estos diagnósticos y procedimientos.
Cooper et al. [5] estudiaron la sensibilidad de los datos de Medicare para identificar próstata incidente, pulmón, colorrectal, de mama, de páncreas y de los casos de cáncer de endometrio. Un algoritmo por Freeman et al. [6] para identificar los casos de cáncer de mama incidente sobre la base de las reclamaciones de Medicare tenido una alta sensibilidad (90%), y también se mide la especificidad y el valor predictivo positivo de su algoritmo. McClish y Penberthy [7] utilizan las reclamaciones de Medicare para cuantificar el número de casos perdidos en el registro de cáncer de Virginia. reclamaciones de Medicare crean una oportunidad única para su trabajo, ya que requiere los datos de tres fuentes distintas: el registro de cáncer de Virginia, la Parte A de Medicare afirma, y las reclamaciones de la Parte B de Medicare. Mandelblatt et al. [8] y Mandelblatt et al. [9] se utiliza el algoritmo de Freeman et al. [6] para identificar los casos de cáncer de mama para investigar tratamientos y percepciones de tratamiento contra el cáncer. De particular interés para Mandelblatt et al. [8] fueron las disparidades raciales. Además del algoritmo desarrollado por Freeman et al. [6], Nattinger et al. [10] Se ha creado un algoritmo de cuatro pasos para identificar los casos de cáncer de mama entre la población de Medicare y mejoró el valor predictivo positivo (≥89%) para la identificación de los casos, al tiempo que conserva un alto nivel de sensibilidad y especificidad.
En este estudio, la SEER-Medicare vinculado base de datos se utilizó para derivar un algoritmo que identifica los casos incidentes de cáncer OP entre los ancianos utilizando sólo las reclamaciones de Medicare. Este algoritmo puede permitir a futuros estudios para abordar cuestiones de investigación sobre el cáncer de OP a través de los datos secundarios se analizan en las reclamaciones de Medicare. Los individuos identificados por el algoritmo de forma simultánea se pueden vincular a su historial médico (reclamaciones de Medicare) para evaluar las trayectorias de salud. Las estimaciones de las tasas de incidencia de cáncer de OP también se pueden derivar de utilizar este algoritmo para los beneficiarios de Medicare, una gran población base inclusiva de muchas poblaciones rurales y otras de difícil alcance en los Estados Unidos.
Métodos Fuente de datos
La base de datos vinculada SEER-Medicare se utilizó para este estudio. El Centro de Servicios de Medicare y Medicaid vinculado Vigilancia, Epidemiología y Resultados de los datos del registro (SEER) End tumorales con las reclamaciones y censo de la información de Medicare para crear el SEER-Medicare vinculado base de datos. Estos datos contienen información sobre las personas con cáncer, e identificados como casos en el registro de tumores SEER, que también tenían un seguro Medicare según lo indicado por los registros de inscripción de Medicare. Casi todos (97%) de la población de 65 años o mayores en los Estados Unidos tienen una cobertura de seguro de salud de Medicare [11], que proporciona la hospitalización del paciente, un centro de enfermería especializada, atención domiciliaria y cuidados paliativos (Parte A) de cobertura. La mayoría de los beneficiarios también tienen cobertura de servicios médicos y de atención ambulatoria (Parte B) [11]. La información demográfica también estaba disponible a partir de archivos de Medicare de inscripción, incluyendo la pertenencia a organizaciones de mantenimiento de salud, o HMO [11]. Para este estudio, sólo para pacientes hospitalizados (Parte A) y el médico y el paciente ambulatorio se utilizaron las reclamaciones (Parte B) de Medicare. Investigaciones anteriores de la base de datos SEER-Medicare indicaron que también se incluyeron en la base de datos SEER-Medicare para los sujetos de entre 65 años y aproximadamente el 93,6% de los casos en el registro de tumores SEER mayores [12]. Francia El SEER-Medicare vinculado base de datos constaba de dos tipos de archivos denominador, el derecho del paciente y diagnóstico Compendio de Datos (PEDSF) y archivos resumidos Denominador (SumDenom). El archivo contenía PEDSF datos demográficos del paciente recogidos por tanto SEER y la Administración de Seguridad Social. Estas medidas incluidas, como la fecha de nacimiento, raza, etnia, país de residencia, la elegibilidad de Medicare, la pertenencia HMO y la fecha de la muerte. Sólo los individuos diagnosticados en un registro SEER con cáncer fueron incluidos en el archivo PEDSF; por lo tanto, medidas de tumores (por ejemplo, sitio del cáncer, la fecha de diagnóstico, estadio de tumor, etc.) a partir de SEER también se incluyeron en estos archivos. Nuestro archivo de PEDSF incluyó a pacientes en la base de datos vinculada SEER-Medicare cuyo diagnóstico del cáncer se llevó a cabo entre 1973 y 2002. Se obtuvieron 100% files para los sujetos con cánceres diagnosticados OP durante estos años. Los sujetos con cánceres distintos de cáncer de OP no se incluyeron en estos análisis. El archivo SumDenom contenía información demográfica similar a la PEDSF, con su información recopilada exclusivamente de la Administración de Seguridad Social. La información contenida en el archivo SumDenom era una muestra de 5% de las personas que viven en zonas SEER que no se había vinculado a un registro de tumores SEER. La información en nuestro archivo SumDenom abarcó los años 1986 a 2004. Francia El reclamaciones de Medicare porciones del SEER-Medicare vinculados base de datos (como paciente interno, médico y archivos de consulta externa) estaban relacionados entre sí a través de una variable de identificador de temas específicos común. Los archivos de proveedor de Medicare Análisis (MEDPAR) contenían reclamaciones de pacientes hospitalizados. Estos incluyen los códigos ICD-9-CM diagnóstico, códigos de procedimiento ICD-9-CM, así como las fechas correspondientes de los diagnósticos y procedimientos. Los archivos /proveedor (médico) 100% del médico son un subconjunto de los archivos Nacional historial de reclamaciones, y se conocen como los archivos de NCH. Estos datos incluyen los códigos de diagnóstico ICD-9-CM y un código de procedimiento CPT, junto con las fechas correspondientes de estos diagnósticos y procedimientos. Los archivos estándar para pacientes ambulatorios Analítica (ambulatoria) fueron también un subconjunto de los archivos Nacional historial de reclamaciones, y se conocen como los archivos OutSAF. Estos datos incluyen los códigos ICD-9-CM diagnóstico, códigos de procedimiento ICD-9-CM, y un código de procedimiento CPT con las fechas de acompañamiento.
Cohorte del estudio
Un total de 3.050 casos de cáncer de OP incidente con una fecha de diagnóstico de se identificó el año civil 2002. El límite mínimo de edad para la inclusión fue de 66 años para tener en cuenta los temas de envejecimiento en Medicare a los 65 años para cumplir con los criterios de cobertura anterior, dejando a 2.751 casos. Para garantizar una información completa de la historia médica de cada sujeto, sólo los sujetos con la cobertura de Medicare (Partes A y B), pero no por un HMO durante el año antes del diagnóstico a través del año después del diagnóstico (o por medio de la muerte para los sujetos que murieron dentro de un año de su diagnóstico) se incluyeron. A raíz de esta exclusión, se mantuvieron 1.807 casos de cáncer de OP. Para los controles sin cáncer, 472,293 sujetos fueron identificados a partir del archivo SumDenom tan vivos en 2002. Una "fecha de pseudo-diagnóstico" fue asignado al azar como una fecha en el año civil 2002. (Estrategias de asignación al azar alternativa sería poco probable influencia los resultados como tendencias temporales correspondientes a las reclamaciones asociadas con la incidencia de cáncer OP se preveía.) Un total de 368,666 controles tenían al menos 66 años de edad en estos datos pseudo-diagnóstico. Utilizando los mismos criterios de inclusión /exclusión para estos temas de Medicare y sin cobertura de HMO en la fecha de pseudo-diagnóstico y su correspondiente ventana de tiempo dejó 242,654 sujetos de control del cáncer no-OP.
Estudio de medidas
se identificaron los cánceres OP mediante el RECODIFICAR sitio variable a partir de los archivos PEDSF. Los valores enteros de 1-10 significaban los siguientes tipos de cáncer (respectivamente): el labio; lengua; glándula salival; piso de la boca; goma y otra boca; nasofaringe; amígdala; orofaringe; hipofaringe; y otra cavidad oral y la faringe. Para los sujetos con más de un diagnóstico primario a los 66 años o mayores de cáncer de OP, se utilizó la ocurrencia diagnosticado en el año civil 2002. La muestra representativa de individuos que sirvieron como grupo control consistió en observaciones desde el archivo SumDenom. No eran necesarias las variables para identificarlos como los controles, ya que su posición en este archivo de ejemplo 5% de ellos identificados como beneficiario de Medicare que viven en una zona SEER que no habían sido diagnosticados con cáncer.
Evaluación del rendimiento del algoritmo en todos varias características demográficas se llevó a cabo en el proceso de validación. Se utilizaron las siguientes medidas contenidas en ambos archivos PEDSF y SumDenom para este análisis: grupo de edad, sexo y raza y el origen étnico. Diagnóstico y procedimiento códigos de reclamaciones de Medicare se utilizaron para el algoritmo para predecir si un individuo es un caso incidente cáncer OP o no (un control). Las fechas que se correspondían con estos diagnósticos y procedimientos también se encuentran en las reclamaciones de Medicare, y se utilizaron para limitar la aparición de este tipo de códigos para dentro de un año (antes o después) de la fecha de su potencial de incidencia.
Construcción del algoritmo
Para generar nuestro algoritmo, 1.807 nuevos casos de cáncer de OP con una fecha de diagnóstico en el año calendario 2002, que se reunieron fueron identificados los criterios de inclusión. Un total de 242,654 sujetos de los archivos SumDenom que estaban vivos en 2002 y se le asignó al azar una "fecha de pseudo-diagnóstico" en el año civil 2002. Se seleccionaron las reclamaciones de Medicare (MEDPAR, NCH, y OutSAF) para estos sujetos que tenían una fecha dentro de un año (un año antes a través de un año después) la fecha, fecha de diagnóstico /pseudo-diagnóstico. Se utilizaron los códigos de procedimiento ICD-9 y los códigos de procedimiento CPT de estas afirmaciones. Se seleccionó una muestra de 60% aleatorio simple (sin reemplazo) de estos sujetos para derivar el algoritmo (n = 1.085 casos de cáncer de OP; n = 145,548 controles), dejando el 40% restante (n = 722 casos de cáncer de OP; n = 97,106 controles ) disponible para su validación. Las tablas de contingencia se generaron para comparar las características demográficas y clínicas de la construcción algoritmo (60%) y validación (40%) muestras. Estas características se compararon entre las muestras utilizando la prueba de chi-cuadrado de Pearson.
Reclamaciones de Medicare se utilizaron para generar coeficientes de ponderación para el algoritmo. Cada fuente de demanda (MEDPAR, NCH, y OutSAF) se trató por separado en el proceso que sigue. El primer paso en el algoritmo era reducir el número de tipos de notificación. Por lo tanto, utilizando los casos OP, sólo los procedimientos que tenían un código de diagnóstico ICD-9 para el cáncer de OP (valores 140.XX-149.XX) al menos 50% del tiempo que se produjo el procedimiento fueron retenidos. A continuación, las frecuencias relativas de ocurrencia de (al menos uno) de cada una de estas únicas CIE-9 y CPT códigos de procedimiento en las reclamaciones entre los casos OP se derivaron, y luego otra vez entre los controles. El registro
2 de la relación de estas frecuencias relativas (de presencia para cada código de procedimiento ICD-9 y cada código CPT dentro de cada fuente de demanda) entre los casos OP y entre los controles se utilizó para generar un peso para cada código. (Para los códigos que se han producido sólo entre los casos de OP, el valor de frecuencia relativa utilizada por los sujetos de control era uno dividido por el número de controles más uno para evitar la división por cero.) Los pesos con un valor menor o igual a las cuatro de la CIE -9 códigos de procedimiento y códigos CPT se igualarán a cero. (Esto se justifica sobre la base de baja discriminación entre las frecuencias relativas entre los casos de OP en comparación con los controles.) Una puntuación para cada caso OP y para cada control se genera sumando los pesos para cada código que estuvo presente durante sus dos años ventana alrededor de sus fechas de diagnóstico /seudo-diagnóstico. Pesos para la presencia de un diagnóstico valor de código ICD-9 de 140.XX-149.XX (código de diagnóstico de cáncer OP) también se generaron mediante la adopción de la log 2 de la relación de las frecuencias relativas de la aparición de un código de este tipo ( en cada fuente de datos) entre los casos de OP en relación con los controles no cancerosas, a continuación, la adición de este peso a la puntuación de cada sujeto. Formalmente, la ecuación para la determinación de cada uno de los sujetos marcador era Score = Σ
x
Med ·
Código s
Med < mtr> + Σ
x
NCH ·
Código s
NCH +
Σ
x
Fuera ·
Código s
Fuera donde: Códigos
Med
representado los diferentes pesos de los procedimientos y diagnóstico ICD-9 códigos y los códigos de procedimiento CPT ha definido anteriormente desde la fuente de datos y MEDPAR x
Med
representado las variables indicadoras correspondientes (1 si está presente; 0 si no está presente) de si el sujeto tenía el código en sus reivindicaciones durante la ventana de tiempo definido; Códigos
NCH
yx
NCH
representado estos valores para la fuente de datos NCH; Códigos y
Fuera
yx
Fuera
ellos representado por la fuente de datos OutSAF.
Teniendo en cuenta las puntuaciones obtenidas para cada fuente de datos (MEDPAR, NCH, y OutSAF ), el algoritmo identifica a los sujetos como casos si tenían un valor positivo en cualquiera de estas tres puntuaciones. Los sujetos con un valor de cero en los tres de estas puntuaciones fueron identificados como no tener cáncer de OP por el algoritmo. Los histogramas de las puntuaciones para cada fuente de datos y la fuente combinada se presentaron para casos de cáncer de OP y controles. (Debido al tamaño de la fuente de datos para los controles, una muestra aleatoria simple [sin reemplazo] de los que no tienen cáncer de OP se utilizan para seleccionar sujetos para estos histogramas.) Otros puntos de corte también se exploraron y unas características de funcionamiento del receptor ( se presentó ROC) curva [13]. Los puntos de corte adicionales incluyen la distancia euclidiana mínima desde el punto (0%, 100%) en la curva ROC (que representa 100% de sensibilidad y especificidad del 100%), y uno que maximiza la especificidad. Las estimaciones de sensibilidad y especificidad, junto con sus correspondientes intervalos de confianza del 95% [13] fueron generados para cada uno de estos puntos de corte.
Validación del algoritmo
Uso de los pesos para cada código utilizado para derivar el algoritmo, las puntuaciones fueron generado para todas las reclamaciones de Medicare (MEDPAR, NCH, y OutSAF) para cada sujeto durante sus ventanas de tiempo individuales (centrado en su fecha de diagnóstico /seudo fecha de diagnóstico) en la muestra restante 40%, se llama la muestra de validación. Los sujetos que tenían un valor positivo en cualquiera de estas tres puntuaciones fueron identificados por el algoritmo como un cáncer de OP, y los que tienen un valor de cero en todos los tres de estos resultados se identificaron como no tener cáncer de OP. Para la comparación, el algoritmo también se evaluó en los puntos de corte adicionales descritos anteriormente. El a priori
hipótesis de la investigación fue que el algoritmo derivado tendrían valores de sensibilidad y especificidad de al menos el 85% y 95%, respectivamente. También se generaron estimaciones puntuales e intervalos de confianza del 95% para estos sensibilidad y especificidad [13].
variación en la sensibilidad y la especificidad por factores demográficos también se evaluó. Usando la muestra de validación, modelos de regresión logística incondicional [14] para predecir el estado del cáncer según lo determinado por el algoritmo se generaron, primero entre los que tienen cáncer de OP (para la sensibilidad) y luego entre los controles (por especificidad). Eliminación hacia atrás se utiliza para seleccionar el modelo utilizando grupo de edad, sexo y raza y el origen étnico. Se permiten todas las posibles interacciones, y el criterio de selección fue ajustado en P & lt; 0,1 (test de Wald) de permanecer en el modelo. La hipótesis a priori
investigación fue que los valores de sensibilidad y especificidad no variarían por subgrupos demográficos. probabilidades predichas y sus correspondientes intervalos de confianza del 95% se calcularon [14]. El ajuste del modelo se evaluó usando la Hosmer-Lemeshow prueba de bondad de ajuste [14].
Valores predictivos positivos y negativos también se estimaron para el algoritmo en la muestra de validación. Estos valores representan: la probabilidad de que un sujeto identificado por el algoritmo como un caso de cáncer OP fue, de hecho, un caso de cáncer de OP (valor predictivo positivo); y la probabilidad de que un sujeto se indica por el algoritmo como un sujeto de control verdaderamente no tenía cáncer OP (valor predictivo negativo). Debido a que los controles sólo representaban una muestra de 5% de la población que, los sujetos de esta muestra fueron ponderados por un factor de 20 para obtener una estimación apropiada para estos valores. Noventa y cinco por ciento intervalos de confianza [13] se estimaron para esta muestra inflado para estas estimaciones.
Este proyecto fue aprobado por el Comité de Asuntos de la Universidad de Kansas Centro Médico Humanos (HSC # 10914). SAS versiones 9.1, 9.2, y 9.3 (SAS Institute, Cary, NC) se han utilizado para la gestión de datos y análisis.
Resultados Estar entre los casos de cáncer de OP, las distribuciones de los grupos de edad, sexo y raza y el origen étnico eran similar entre el edificio algoritmo y las muestras de validación. Lo mismo puede decirse de las muestras de control también. Estos resultados se presentan en la Tabla 1 1.Table Las distribuciones de frecuencia (%) de las características de las muestras de construcción y validación algoritmo
Característica
Algoritmo muestra edificio
Validación muestra
Pearson'sx 2 test, p-valor
casos de cáncer de OP *
1.085 (100,0)
722 (100,0) guía empresas
Grupo de edad 66-69
201 (18,5)
116 (16,1) guía empresas 0,1370
70-74
271 (25,0)
184 (25,5)
75-79
266 (24,5)
195 (27,0)
80-84
205 (18,9)
114 (15,8)
85 años
142 (13,1)
113 (15,7)
Sexo Femenino
417 (38,4)
287 (39,8) guía empresas 0,5738
Hombre
668 (61,6)
435 (60,3)
raza y la etnia
Negro
59 (5.4)
43 (6,0)
0.8859
hispana
17 (1,6)
9 (1.3)
Otros
49 (4,5)
30 (4.2)
blanca
960 (88,5)
640 ( 88,6)
controles no cancerosas
145548 (100,0)
97.106 (100,0)
un grupo de edad 66-69
28.549 (19,6)
19.036 (19,6) guía empresas 0,2610
70-74
36.729 (25,2) guía empresas 24.269 (25,0)
75-79
33.361 (22,9)
22.597 (23,3)
80-84
24.635 (16,9)
16.479 (17,0)
85 años
22.274 (15,3)
14,725 (15.2)
Sexo Femenino
89.736 (61,7)
60,050 (61,8) guía empresas 0,3564
Hombre
55.812 (38,4)
37056 ( 38.2)
raza y la etnia
Negro
10.385 (7.1) guía empresas 7,148 (7,4) guía empresas 0,0037
hispana
3.685 (2,5)
2.279 (2,4)
Otros
8.681 (6,0)
5.897 (6,1)
blanca
122 797 (84,4)
81.782 (84,2)
* OP:. oral y faríngea
algoritmo construido
los pesos de cada uno de los códigos para generar se presentaron puntuaciones generales (véase la disposición 1: Apéndice Tablas AD). Utilizando el punto de corte de un positivo (GT &; 0) Resultado, la sensibilidad y la especificidad fueron del 93,9% y 96,2%, respectivamente. Los histogramas de las distribuciones de las puntuaciones entre los casos de cáncer de OP y los controles se presentan en la Figura 1. La curva ROC para varios puntos de corte de la puntuación algoritmo para indicar un caso de cáncer OP se presenta en la Figura 2, centrándose solamente en los valores con alta especificidad (& gt; 96%). Esta cifra indica que el valor con la menor distancia euclidiana desde el punto (0%, 100%) en la curva ROC tenía una alta especificidad. Esta distancia mínima se produjo cuando las reclamaciones de Medicare calificar tenían un valor & gt; 5,48, y produjo una sensibilidad del 93,8% y una especificidad del 97,1%. Utilizando un enfoque más ad hoc de dar prioridad a la maximización de la especificidad (debido a la relativamente rara incidencia de cáncer OP), se encontró que un punto de corte de & gt; 37,43 tuvo una sensibilidad del 75,0% y una especificidad del 99,3%. Estos resultados, junto con los correspondientes intervalos de confianza del 95%, se presentan en la Tabla 2. La Figura 1 histogramas de las puntuaciones basadas en las reclamaciones de Medicare fuente y el total combinado *. * Oral y faríngeo (OP) caso del cáncer (magenta) y anota (azul) de control; barras verticales de referencia para: la puntuación inicial del punto de corte (& gt; 0, que indica el algoritmo de identificación como un caso de cáncer OP) que tuvo una sensibilidad del 93,9% y una especificidad del 96,2%, el punto de corte mínima distancia euclídea (& gt; 5,48) que tuvo una sensibilidad del 93,8% y una especificidad del 97,1%, y para el punto de corte que maximiza la especificidad (& gt; 37,43). que tuvo una sensibilidad del 75,0% y 99,3% de especificidad
figura 2 características operativas del receptor (ROC) curva de puntajes en base a reclamaciones de Medicare para la identificación de los casos de cáncer oral y faríngea incidente *. * Las líneas de referencia indicados: para la puntuación inicial del punto de corte (& gt; 0, que indica el algoritmo de identificación como un caso de cáncer OP) tuvo una sensibilidad del 93,9% y una especificidad del 96,2%; la sensibilidad y especificidad para la distancia euclídea punto de corte mínima (& gt; 5,48) fueron 93,8% y 97,1%, respectivamente; y para el punto de corte que maximiza la especificidad (& gt; 37,43), la sensibilidad fue del 75,0% y una especificidad del 99,3% sobre Table 2 valores de sensibilidad y especificidad para diferentes puntos de corte de puntuación de la construcción de modelos y muestras de validación
. reclamaciones de Medicare puntuación de corte punto
Sensibilidad (IC del 95%) *
Especificidad (IC del 95%) *
& gt; 0,00
93,9 (92.5-95.3) /95,3 (93.8-96.8)
96,2 (96.1-96.3) /96,0 (95.9-96.2)
& gt; 5,48
93,8 (92.4-95.3) /95,3 (93.8-96.8)
97,1 (97.0-97.2) /97,0 (96.9-97.1)
& gt; 37,43
75,0 (72.5-77.6) /79,8 (76.9-82.7)
99,3 (99.3-99.3) /99,3 (99.2-99.3)
*%; IC: intervalo de confianza; valores de las muestras edificio algoritmo /valores de la muestra de validación.
validación del algoritmo
Los diferentes puntos de corte de punto produjo valores de sensibilidad y especificidad similar a la de la muestra edificio algoritmo. El punto de corte punto inicial (& gt; 0, que indica el algoritmo de identificación como un caso de cáncer OP) tenían una sensibilidad del 95,3% y una especificidad del 96,0%. La sensibilidad y especificidad para la distancia euclídea punto de corte mínima (& gt; 5,48) fueron 95,3% y 97,0%, respectivamente. Para el punto de corte que maximiza la especificidad (& gt; 37,43), la sensibilidad fue del 79,8% y una especificidad del 99,3%. Estos resultados, junto con los correspondientes intervalos de confianza del 95%, se presentan en la Tabla 2. Francia El modelo de sensibilidad indicó que la sensibilidad fue menor para los hombres que para las mujeres (p = 0,0531). La sensibilidad estimada fue de 97,2% para las mujeres y 94,2% para los hombres. (Teniendo en cuenta el número de parámetros en este modelo, la prueba de bondad de ajuste de Hosmer-Lemeshow no podía llevarse a cabo.) El modelo de la especificidad era más compleja. El modelo final incluyó grupo de edad (p & lt; 0,0001), el sexo (p & lt; 0,0001), la raza y el origen étnico (p = 0,0158), y el grupo de edad por la raza y la etnia interacción (p = 0,0072). No se detectó en forma de falta de significativa para este modelo (p = 0,5155). Todos menos uno grupo de edad-por-sexo-por-la raza y la etnicidad subgrupo tuvo una especificidad valores estimados superiores a 95%. El grupo con especificidad por debajo de este umbral era hombres hispanos de 85 años o más, y tenía un valor de 94,0%. La sensibilidad y especificidad y los valores estimados correspondientes intervalos de confianza del 95% de esos modelos se presentan en la Tabla 3. Cabe destacar que, mientras que no se detectaron variaciones estadísticamente significativas, los valores de sensibilidad y especificidad fueron similares en todos groups.Table 3 ajustado los valores de sensibilidad y especificidad para la euclidiana mínima distancia de punto de corte de las muestras de validación
sensibilidad (95% intervalo de confianza)
mujeres (independientemente del grupo de edad y la raza y la etnicidad) guía empresas 97,2 (94,5-98,6)
varones (independientemente del grupo de edad y la raza y la etnicidad) guía empresas 94,0 (91,4-95,9)
especificidad (95% intervalo de confianza)
Edad 66-69
Mujer
Negro
97,3 (96,4-97,9)
hispana
98,0 (96,1-99,0)
Otros
98,2 (97,3-98,7)
blanca
97,6 (97,4 -97.8)
Hombre
Negro
96,4 (95,3-97,2)
hispana
97.4 ( 94,9-98,7)
Otros
97,5 (96,4-98,3)
blanca
96,8 (96,5-97,2)
Edad 70-74
Mujer
Negro
97,6 (96,8-98,2)
hispana
98,3 (97,2-99,0)
Otros
98,2 (97,5-98,8)
blanca
97,1 (96,9 Todos los autores han leído y aprobado el manuscrito final.