Fusión de datos y análisis multivariado para análisis de autenticidad de alimentos

Nature Communications volumen 14, Número de artículo: 3309 (2023) Citar este artículo

322 Accesos

40 Altmetric

Detalles de métricas

Se aplica una fusión de datos de nivel medio junto con un enfoque de análisis multivariante a conjuntos de datos de espectrometría de masas de plataforma dual utilizando espectrometría de masas de ionización evaporativa rápida y espectrometría de masas de plasma acoplado inductivamente para determinar la clasificación correcta del origen del salmón y los métodos de producción. En el estudio se utilizan salmones (n = 522) de cinco regiones diferentes y dos métodos de producción. El método logra una precisión de clasificación de validación cruzada del 100 % y todas las muestras de prueba (n = 17) tienen sus orígenes determinados correctamente, lo que no es posible con los métodos de plataforma única. Se encontraron dieciocho marcadores de lípidos robustos y nueve marcadores elementales, que proporcionan evidencia sólida de la procedencia del salmón. Por lo tanto, demostramos que nuestra fusión de datos de nivel medio: la estrategia de análisis multivariado mejora en gran medida la capacidad de identificar correctamente el origen geográfico y el método de producción del salmón, y este enfoque innovador se puede aplicar a muchas otras aplicaciones de autenticidad alimentaria.

El consumo mundial de salmón es tres veces mayor que en 19801. Lo que alguna vez se consideró un manjar es ahora una de las especies de pescado más populares en los Estados Unidos (EE. UU.)2, Europa (UE)3 y los países asiáticos4. El salmón del Atlántico y del Pacífico son las dos principales fuentes de salmón del mundo. Casi el 70 % de toda la producción de salmón se cultiva y, en 2020, se produjeron más de 2,6 millones de toneladas de salmón de cultivo, en comparación con solo alrededor de 550 000 toneladas de salmón silvestre1. Los precios del salmón pueden ser volátiles5, pero se han más que duplicado en los últimos 10 años y ahora son más altos que muchos productos comparables6. La acuicultura a gran escala se utiliza para producir salmón del Atlántico en los hemisferios norte y sur, y se ha convertido en el pescado más comúnmente cultivado en el mundo occidental7,8.

Las principales regiones de consumo de salmón son la UE, seguida de EE. UU., Brasil, China, Rusia y Japón9. Cuando se preguntó a los consumidores de China, se descubrió que la calidad y el valor eran los factores más importantes a la hora de comprar salmón. El 77 % de los encuestados creía que el salmón salvaje de Alaska sabía mejor que la variedad de piscifactoría, lo que indica que los consumidores chinos estaban más interesados en comprar salmón salvaje10. Los consumidores japoneses disfrutan del mercado de salmón más diversificado del mundo. El precio del salmón en este mercado está determinado por la oferta y demanda total de todas las especies de pescado11. Un informe mostró que en algunas regiones de América del Norte, los consumidores de productos del mar tienen preferencia por el salmón silvestre sobre el salmón de piscifactoría12. Sin embargo, es posible que no reciban el tipo y la calidad de salmón por el que pagaron. Hu et al.13 utilizando códigos de barras de ADN y métodos de códigos de barras mini de ADN revelaron una tasa de etiquetado incorrecto del 25 % en los productos pesqueros de Vancouver. Un problema importante es que el salmón puede viajar desde un barco de pesca de Alaska a una planta procesadora china y luego a una tienda minorista en Nueva York, mientras que la información sobre el pescado, como de dónde vino y si fue capturado o criado, puede perderse o modificarse de manera fraudulenta a medida que viaja a lo largo de la más compleja de las cadenas de suministro14.

En la literatura científica, las medidas para identificar el etiquetado incorrecto del pescado son comunes en el campo de la investigación de la autenticidad15. El código de barras de ADN se utilizó para identificar el reemplazo de mercado del salmón del Atlántico por el salmón del Pacífico16. Más recientemente, Deconinck et al.17 presentaron un método Droplet Digital PCR para la identificación y cuantificación del porcentaje de salmón del Atlántico en productos alimenticios procesados y mixtos, lo que permite la identificación y semicuantificación de tejido específico de salmón en productos alimenticios procesados que contienen múltiples especies. . En los últimos años, la espectrometría de masas (MS) se ha vuelto más popular como herramienta en la investigación de la autenticidad de los alimentos. Fiorino et al.18 describieron un método de análisis directo en tiempo real: espectrometría de masas de alta resolución (DART-HRMS) para la discriminación de salmón de cultivo y de tipo salvaje. Si bien estudios anteriores informaron sobre técnicas de análisis de autenticidad del salmón, estos métodos están sujetos a largos procedimientos de preparación de muestras y no lograron un nivel de precisión suficiente en términos de trazabilidad geográfica19. Se desarrollaron una espectroscopia de infrarrojo cercano y un método ICP-MS, combinados con enfoques quimiométricos para determinar la discriminación entre el salmón de cultivo chileno y el de origen noruego20. Más recientemente, Chang et al.21 publicaron un método LC-HRMS para discriminar el origen del salmón del Atlántico de Noruega y Chile. Es necesario monitorear la autenticidad del origen geográfico del salmón, pero la procedencia y la cantidad de muestras requeridas para desarrollar y validar métodos no específicos deben considerarse cuidadosamente, ya que esto tendrá una gran influencia en la solidez de cualquier procedimiento desarrollado.

El patrón de crecimiento de crucero del salmón hace que su calidad de consumo esté muy influenciada por el entorno de crecimiento, la dieta y las respuestas agudas al estrés22, por lo que es muy poco probable que un solo enfoque analítico proporcione toda la información necesaria para garantizar la autenticidad. La espectrometría de masas de ionización por evaporación rápida (REIMS) es una técnica que ha demostrado proporcionar análisis in situ en tiempo real sin necesidad de ningún tratamiento previo de la muestra, y ha demostrado un rendimiento excelente en una variedad de aplicaciones de autenticidad de alimentos, y la mayoría particularmente en análisis de peces23,24. La espectrometría de masas de plasma acoplado inductivamente (ICP-MS) se consideró como la primera opción de plataformas de instrumentos para realizar análisis elementales, y ha demostrado ser una técnica poderosa para las pruebas de autenticidad de los alimentos, ya que se ha utilizado para determinar el origen geográfico de varios alimentos. productos como arroz25, té26 y miel27.

Estudios recientes han demostrado que la fusión de datos junto con enfoques quimiométricos puede evaluar y clasificar de manera efectiva la calidad de los productos alimenticios, lo que indica el potencial significativo del análisis estadístico multivariante de fusión de datos en la investigación de la autenticidad de los alimentos28,29,30. Robert et al.31 investigaron la capacidad predictiva de la espectroscopia Raman e infrarroja junto con estrategias de fusión de datos para evaluar la calidad de la carne roja. Un estudio realizado por Ottavian et al.32 confirmó que las estrategias de fusión de datos se pueden utilizar de manera efectiva para mejorar la precisión de la clasificación en la discriminación de pescado fresco y congelado-descongelado. Sin embargo, no se ha realizado ninguna investigación previa sobre la utilización combinada de ICP-MS y REIMS junto con la fusión de datos y el enfoque de análisis multivariado para autenticar el origen del salmón y el método de producción.

El enfoque del presente estudio fue establecer la mejor manera de determinar la autenticidad del salmón en términos de sus orígenes geográficos y diferenciar los orígenes silvestres de los de piscifactoría. Se emplearon dos plataformas de espectrometría de masas diferentes para llevar a cabo enfoques lipidómicos y elementalómicos y los datos generados se sometieron a modelado quimiométrico avanzado y aprendizaje automático.

Se recolectó una gran cantidad (n = 522) de muestras de salmón de procedencia conocida de cuatro regiones (Alaska, Noruega, Islandia y Escocia) y dos métodos de producción (criadero y salvaje). Estos se analizaron para identificar y caracterizar biomarcadores en función de sus perfiles lipídicos y elementales que podrían usarse para verificar los orígenes y el método de producción del salmón. Se utilizó un método de análisis de datos multivariante basado en la fusión de datos de nivel medio para demostrar cómo se puede utilizar esta técnica para proporcionar un enfoque científico preciso para verificar la trazabilidad del salmón. Se utilizaron diecisiete muestras de salmón compradas en varios supermercados del Reino Unido para evaluar la solidez y credibilidad de este método.

Para explorar la capacidad de identificar regiones específicas de cultivo de salmón, se adoptó el análisis de compuestos principales (PCA) como método de extracción de características lineales no supervisadas para reducir la dimensionalidad de los datos de REIMS. Los datos espectrales resultantes se preprocesaron antes de someterlos a PCA. Los resultados, que se muestran en la Fig. 1a, demuestran las diferencias relativas entre las cuatro regiones incluidas en el estudio (Alaska, Noruega, Islandia y Escocia). Se usaron gráficos de carga para revelar la composición del componente principal individual en el PCA (Fig. 1b). Las funciones de carga (Fig. 1c) para datos de masas muestran la contribución de los picos espectrométricos de masas individuales al segundo componente principal (PC2). Los picos de la gráfica de carga corresponden a especies de ácidos grasos (incluidos los ácidos grasos insaturados y ramificados), diacilglicerofosfogliceroles (GP0401), diacilglicerofosfocolinas (GP0101) y triradilgliceroles (GL0301) con identificaciones tentativas realizadas mediante el uso de la base de datos LipidMaps33.

un gráfico de puntuación PCA entre el salmón de Alaska, el salmón islandés, el salmón noruego y el salmón escocés: se observaron diferencias intragrupo en el modelo PCA para el grupo de Islandia (punto azul claro). PC1 y PC3 se muestran para mayor claridad. El CP1 contribuyó con el 38,37% del total de variaciones explicadas y el CP3 tiene una contribución del 15,26% del total de variaciones explicadas. b Gráfica de carga de PC1 y PC3 entre 4 grupos de salmón. c Gráfica de carga de PC2 entre 4 grupos de salmones, que tuvo una contribución del 24,0% en las variaciones totales explicadas. d Gráfica de puntuación de PCA entre el salmón de cultivo de Islandia y el salmón salvaje de Islandia. e Gráfico de carga de PC1 y PC2 entre el salmón salvaje y el de piscifactoría de Islandia.

El grupo de salmón islandés se dividió claramente en dos secciones en el gráfico PCA (Fig. 1a). Uno de estos se refería a 90 muestras de salmón capturado en la naturaleza, y las 50 muestras restantes eran de origen de piscifactoría. Se creó un modelo quimiométrico (Fig. 1d) para clasificar las muestras de salmón de Islandia como "salmón salvaje" o "salmón de piscifactoría", y el gráfico de puntuación de PCA muestra claramente diferencias sustanciales entre estos dos grupos de salmón. Los resultados de CV-ANOVA del modelo PCA mostraron que había una diferencia significativa entre los grupos de salmón salvaje y de cultivo de Islandia (p < 0,001). La Figura 1e muestra el gráfico de carga entre PC1 y PC2, que nuevamente demuestra claramente las diferencias entre los cinco grupos, al igual que los espectros de masas de todos los grupos de muestras de salmón (Figura complementaria S1).

Luego se llevó a cabo el modelado supervisado, haciendo uso de análisis discriminante de mínimos cuadrados parciales ortogonales (OPLS-DA), análisis discriminante de mínimos cuadrados parciales (PLS-DA) y análisis discriminante lineal de análisis de componentes principales (PCA-LDA). . Esto fue para identificar marcadores químicos individuales que tenían las mayores variaciones de intensidad de iones entre cada grupo de salmón. El modelo OPLS-DA (Fig. S2 complementaria) de los grupos de salmón salvaje y salmón de piscifactoría de Islandia mostró las diferencias más claras entre las dos clases y se utilizó en la selección e identificación de biomarcadores. Se generaron múltiples S-plots comparando un grupo con los cuatro grupos restantes para identificar los marcadores químicos que son exclusivos de cada grupo individual. Esto se repitió cuatro veces más hasta que cada grupo se analizó individualmente frente a una combinación de los grupos restantes, lo que resultó en la generación de cinco gráficos S (Figura complementaria S3).

Como se muestra en la Tabla 1, las variaciones de intensidad de iones de un total de 18 biomarcadores candidatos permitieron diferenciar los cinco grupos de salmón. Sin embargo, la identificación del origen del salmón no puede basarse únicamente en estos biomarcadores (Figura complementaria S6) debido a que la cantidad de características es demasiado pequeña para obtener una alta precisión. Los datos de escaneo de MS se usaron para identificar tentativamente los biomarcadores, identificados inicialmente de acuerdo con el sistema de identificación de compuestos HRMS Tier 1–4 propuesto por Schymanski et al.34, que luego se compararon con los grupos de lípidos en la base de datos LipidMaps33. Estos biomarcadores se identificaron tentativamente como grupos lipídicos pertenecientes a ácidos grasos insaturados, amidas primarias, ácidos grasos ramificados, N-acilaminas, diacilglicerofosfogliceroles, diacilglicerofosfocolinas y triacilgliceroles. Como el objetivo de este trabajo no era investigar las posiciones de los enlaces C=C o la presencia de ramificación de cadenas para los FA detectados, no se identificó más el sitio de los enlaces pi carbono-carbono.

Entre los 18 lípidos biomarcadores, se encontraron ocho (FA 15:1, FA 18:3, FA 20:5, FA 22:6, FA 22:1, FA 18:2, FA 18:1, NA 7:0) para ser biomarcadores representativos en al menos tres grupos de salmón (Tabla complementaria S1), por ejemplo, el contenedor masivo 327.3 contenía un biomarcador que se encuentra en los cinco grupos de salmón que podría usarse para diferenciar esos grupos en función de la intensidad de ese compuesto. Dado que estos ocho lípidos eran comunes en el salmón, se evaluó el contenido relativo de ellos en los cinco grupos de salmón respectivamente (Fig. 2a). Los perfiles de ácidos grasos entre los grupos de salmón mostraron diferencias, y cuando se comparó el grupo de piscifactoría (noruego, escocés e islandés) con el grupo salvaje (de Alaska e islandés), este último grupo mostró niveles más altos de omega-3 que promueven la salud ácidos grasos: DHA (FA 22:6), EPA (FA 20:5) y FA 22:1, pero niveles más bajos de ALA (FA 18:3). Los ácidos grasos ramificados (FA 18:1, FA 18:2, FA 18:3) en el salmón noruego, el salmón escocés y el salmón de piscifactoría islandés estaban presentes en niveles más altos que en el salmón de Alaska y el salmón salvaje islandés. Las variaciones observadas que se encontraron probablemente se debieron a las diferencias en las dietas del salmón capturado en la naturaleza frente al salmón de piscifactoría. Se ha informado el aumento del uso de aceites en alimentos para salmón obtenidos de semillas de soja, lino y colza, ricos en AG como 18: 1, 18: 2 y 18: 3, concentraciones de FA 18: 2 y 18: 3 ser más abundante en el salmón de cultivo18, lo que concuerda con los datos generados en el presente estudio.

un histograma de biomarcadores de lípidos entre el salmón de Alaska, el salmón de piscifactoría de Islandia, el salmón salvaje de Islandia, el salmón noruego y el salmón escocés. b Gráfica de puntuación de PCA y c Gráfica de LDA de datos espectrales de REIMS (m/z 200–1200) obtenidos de cinco grupos de salmón. Para las huellas dactilares de espectros de masas de cinco grupos, consulte la figura complementaria S1.

Noruega, el mayor productor mundial de salmón del Atlántico de piscifactoría35, tiene el contenido relativo más alto de FA 18:1, 18:2 y 18:3 en su salmón de piscifactoría, mientras que en términos de contenido de ácidos grasos insaturados, el salmón noruego también se desempeñó bien. Es interesante observar que, después del salmón de Alaska, el salmón de cultivo noruego logró el segundo contenido relativo más alto en FA 15:1 entre los cinco grupos, probablemente como resultado del creciente enfoque de la investigación en los componentes del alimento para salmón36. Se ha demostrado que las dietas de salmón tienen un impacto directo en la composición de lípidos y ácidos grasos musculares, así como en el rendimiento del crecimiento37,38. Giuseppina et al.18 demostraron que la estandarización internacional de las prácticas de acuicultura adoptadas para el salmón puede eliminar las diferencias en el nivel de FA atribuibles a la ubicación geográfica. Por lo tanto, es más probable que la combinación de análisis de lipidómica y eelementómica sea un método confiable y sólido para determinar la procedencia del salmón.

El gráfico de puntuación de PCA muestra los compuestos químicos de cada grupo de muestra. Los valores de R2 y Q2 de 0,957 y 0,93 sugirieron que el modelo PCA era sólido y tenía una buena capacidad predictiva de puntos de datos adicionales. Se ha demostrado previamente que el modelado PCA-LDA funciona bien con los datos de REIMS39. Como resultado de esto, se construyó un modelo LDA utilizando una base de datos de referencia poblada por espectros de masas que presentan tipos de lípidos de pescado de discriminación de origen de salmón, seguido de una evaluación del modelo utilizando una validación cruzada de exclusión del 20 %. Los modelos PCA-LDA (Fig. 2c) mostraron una separación más clara entre el salmón de Alaska, el salmón de cultivo de Islandia, el salmón salvaje de Islandia, el salmón noruego y el salmón escocés.

Se demostró la aplicación de REIMS para el perfilado rápido del origen del salmón, y las huellas dactilares de lípidos de salmón de cinco orígenes diferentes y dos métodos de producción se adquirieron con éxito por primera vez en el presente estudio. Se identificaron ocho lípidos como biomarcadores representativos, de un total de 5500 componentes HRMS. Deje el 20 % fuera La validación cruzada proporcionó una precisión de identificación del 100 % en las muestras de salmón cuando se usa el modelo LDA (Tabla complementaria S2).

Este modelo se utilizó para identificar los orígenes del salmón comprado en varios supermercados del Reino Unido (n = 17). Se encontraron posibles valores atípicos en tres muestras de prueba (Tablas complementarias S2 y S6). Estos valores atípicos fueron muestras de salmón cultivado en Escocia. Los tres resultados atípicos se verificaron con los proveedores minoristas y se confirmó la trazabilidad completa de cada uno, lo que indica que se produjeron errores analíticos en lugar de errores de etiquetado y se atribuyó a este estudio una tasa de éxito general del 82,4 % en la identificación correcta.

Se estableció un método de cribado mediante ICP-MS para el análisis de los siguientes elementos: Li, Be, B, Na, Mg, Al, Si, P, S, K, Ca, Sc, Ti, V, Cr, Mn, Fe, Co , Ni, Cu, Zn, Ga, Ge, As, Se, Rb, Sr, Y, Nb, Mo, Ag, Cd, In, Sn, Sb, Cs, Ba, Tb, Ho, Ta, W, Re, Hg , Tl, Pb, Bi, U. PCA y análisis de conglomerados jerárquicos se realizaron en los datos para lograr la diferencia global de elementos del salmón de los distintos orígenes de las muestras obtenidas (los datos se separaron en cinco grupos: salmón de Alaska, salmón de cultivo salmón salvaje, salmón noruego y salmón escocés). El gráfico de puntuación de PCA muestra la distribución de elementos de cada grupo, lo que representa que los elementos difieren entre cinco grupos (Fig. 3a). Se obtuvieron los valores de R2X y Q2, 0,98 y 0,85, respectivamente, lo que indica que el modelo PCA es robusto y estable. El OPLS-DA se utilizó como modelo supervisado para evaluar los datos de la plataforma ICP-MS (Fig. 3b). Los resultados revelaron que había una buena separación entre los cinco grupos. El OPLS-DA resultó en componentes de todos los elementos con R2X = 1, R2Y = 0,76 y Q2 (cum) = 0,74. Esto sugirió fuertemente que el modelo OPLS-DA tenía una gran capacidad para explicar las diferencias de muestra y demostró cómo la distribución de elementos en el salmón variaba entre los cinco grupos de muestra.

un gráfico de puntuación de los elementos identificados por PCA en cinco grupos de salmón. b OPLS-DA para la discriminación del origen geográfico del salmón. c Mapa de calor del salmón de Alaska, salmón de piscifactoría de Islandia, salmón salvaje de Islandia, salmón noruego y salmón escocés; se indican 20 elementos sobre el mapa de calor.

Antes de continuar con el análisis de datos, se eliminaron los elementos con concentraciones excesivamente altas y aquellos con resultados cuantitativos por debajo del límite de detección. Los 20 elementos restantes se seleccionaron de los datos brutos de ICP-MS; Li, B, Al, V, Cr, Mn, Fe, Co, Ni, Cu, Zn, As, Se, Rb, Sr, Nb, Mo, Cd, Cs y Ta. Se utilizó un análisis de varianza unidireccional de Kruskal-Wallis para evaluar los datos del ICP-MS para evaluar la diferencia de los elementos en la carne de salmón entre los cinco grupos. El nivel de significancia se fijó en 0,05 con el intervalo de confianza en 95%. Los resultados mostraron que hubo diferencias elementales significativas entre los cinco grupos cuando se compararon (Tabla 2).

Luego se determinaron las diferencias entre grupos de estos 20 elementos presentes en los cinco grupos de muestras de salmón. Los mapas de calor se construyeron usando concentraciones normalizadas para muestras de países de origen para definir sus determinaciones de expresión diferencial para revelar las relaciones únicas entre los diferentes orígenes del salmón. Estos se han mostrado en un mapa de calor (Fig. 3c). Los datos de ICP-MS se normalizaron volviendo a escalar utilizando el método de normalización min-max (cambiando la escala del rango de características para escalar el rango en [0, 1]). Los elementos se agruparon en cinco grupos principales de muestras: salmón de Alaska, salmón de cultivo islandés, salmón salvaje islandés, salmón noruego y salmón escocés. Los cambios graduales en rosa, blanco y azul reflejan cuando la concentración de un elemento en el salmón va de mayor a menor y representan las diferencias sustanciales en los niveles de Li, B, V, Fe, Co, Zn, Se, As y Cd en los cinco grupos

Se utilizó un análisis de comparación por pares de elementos para evaluar más a fondo la diferencia entre los cinco grupos (Fig. 4). Los resultados mostraron que no hubo una diferencia estadísticamente significativa en los niveles de litio entre las muestras de salmón cultivado en Alaska e Islandia (p = 0,28). El contenido de boro fue sustancialmente más bajo en el salmón salvaje de Islandia que en los otros cuatro grupos, y el contenido de vanadio fue más bajo en el salmón de cultivo en Islandia. En las muestras de salmón salvaje de Alaska e Islandia, los niveles de hierro fueron más altos que los de los tres grupos de salmón de piscifactoría. El cobalto no mostró diferencias significativas en las concentraciones entre el salmón noruego y el salmón escocés (p = 0,14). El salmón de Alaska tuvo el contenido de cobalto más bajo entre todos los grupos. Los niveles de zinc en el salmón de Alaska, el salmón salvaje de Islandia y el salmón cultivado en Islandia fueron más altos que los del salmón producido en Escocia y Noruega. No hubo diferencias significativas en las concentraciones de zinc entre el salmón de Alaska y el salmón de cultivo en Islandia (p = 0,62). Se demostró que los grupos de salmón salvaje de Alaska e Islandia tenían mayores niveles de selenio que los otros tres grupos.

La figura ilustra las variaciones significativas en los niveles de Li, B, V, Fe, Co, Zn, Se, As y Cd en los cinco grupos de salmón. Se encontró que los grupos de salmón salvaje exhibían niveles elevados de Fe, Zn, Se y Cd en comparación con los grupos de piscifactoría.

Los resultados también mostraron que las muestras de salmón de Islandia (incluidos los de cultivo y salvajes) tenían un contenido de arsénico más alto que las de Noruega y Escocia. No es de extrañar encontrar arsénico en el salmón, ya que los organismos marinos consumidos por esta especie pueden contener altos niveles de arsénico40. La toxicidad del arsénico no está únicamente asociada con la concentración total, sino que también depende de las especies de arsénico presentes, ya que la biodisponibilidad y la bioacumulación en los organismos marinos están influenciadas por la especiación del arsénico40.

También se detectó cadmio en los cinco grupos de muestras de salmón, con niveles claramente más altos en el salmón salvaje de Alaska e Islandia (Fig. 4). No ha habido informes previos de detección de cadmio en el salmón. El cadmio representa un peligro mayor para la salud debido a la muy escasa excreción en el cuerpo humano, y la Agencia Internacional para la Investigación del Cáncer ha clasificado al cadmio como carcinógeno humano (grupo I)41. Se observó que el salmón salvaje tenía niveles más altos de Fe, Zn y Se.

El modelo OPLS-DA se evaluó mediante una validación cruzada de cinco veces. Li, B, V, Fe, Co, Zn, Se, As y Cd se encontraron como marcadores. Sin embargo, se encontró que era difícil distinguir el origen de las muestras de prueba utilizando solo nueve marcadores elementales (Fig. S7 complementaria). Por lo tanto, utilizando el conjunto de datos completo, se logró una precisión de clasificación del 96,9 % para la diferenciación entre cinco grupos de muestras de salmón (Tabla complementaria S3). De las 17 muestras minoristas, solo 11 tenían sus orígenes correctamente identificados (65,5% de precisión). Los resultados de clasificación errónea se observaron en seis muestras (Tablas complementarias S3 y S4). En contraste con los resultados de clasificación de REIMS que tuvieron problemas con la identificación del salmón escocés, las seis clasificaciones erróneas de ICP-MS fueron muestras de salmón salvaje de Alaska.

El procedimiento experimental y de análisis de datos se representa en la Fig. 5. Se llevó a cabo la adquisición de datos de muestras de salmón utilizando REIMS e ICP-MS. Se emplearon técnicas de fusión de datos de bajo y medio nivel para determinar el método de fusión de datos más apropiado. Posteriormente, se analizaron y optimizaron seis modelos quimiométricos con el fin de seleccionar el más adecuado para el análisis de autenticidad del origen y tipo de producción del salmón. A continuación, se utilizó el modelo seleccionado para realizar este análisis.

La adquisición de datos se llevó a cabo utilizando los métodos REIMS e ICP-MS. Luego se llevaron a cabo la fusión de datos y el modelado. PLS-DA y OPLS-DA, identificados como los modelos óptimos en esta investigación, demostraron ser efectivos para analizar la trazabilidad del origen del salmón.

Para evaluar los orígenes geográficos del salmón, se utilizaron dos tipos de conjuntos de datos de espectrometría de masas (uno de REIMS y otro de ICP-MS) para el entrenamiento y la evaluación del modelo. Para REIMS, se realizó un análisis de datos: (i) se usó la sustracción de fondo y se usó un umbral de intensidad de conteo total de iones (<1 × 10−5) para eliminar el ruido de fondo y los compuestos de baja intensidad que pueden introducir un exceso de variabilidad en el proceso de modelado, (ii ) aplicar la corrección lockmass, para garantizar que se minimice cualquier desviación en la estabilidad del espectrómetro de masas entre muestras y cruzar diferentes días para mejorar el rendimiento del modelado, (iii) agrupar los datos de masa HRMS a 0,2 Da para reducir el número de variables utilizadas en el proceso de modelado, mientras que simultáneamente aumentando el nivel de alineación de características entre muestras individuales. En consecuencia, se obtuvieron 5500 puntos de datos de cada muestra. Para ICP-MS, se utilizó un material de referencia certificado (CRM), que incluía 20 elementos, para normalizar los datos originales y monitorear el rendimiento del instrumento.

Se compararon dos tipos de fusión de datos; fusión de datos de bajo nivel y fusión de datos de nivel medio. La fusión de datos de bajo nivel combina varias fuentes de datos sin procesar para producir nuevos datos sin procesar (Fig. 6a). Los primeros 5 compuestos principales (PC) explicaron el 90,3 % de la variación en el conjunto de datos original (R2X acumulativo = 0,90), lo que demuestra el éxito de la fusión de datos de bajo nivel. Además, con valores de Q2 de 0,90, se demostró que el modelo PCA tiene una gran capacidad para explicar las diferencias entre los grupos de salmón. Y las primeras 23 PC explicaron el 95 % de la variación en el conjunto de datos original (R2X acumulativo = 0,95), y la capacidad predictiva del modelo es Q2 = 0,94.

a Fusión de datos de bajo nivel, usando normalización min-max, gráfico de puntuación PCA de 5 grupos de salmón con normalización min-max de datos. b Gráfica de puntuación PCA de fusión de datos de nivel medio de 5 grupos de salmón. c Gráfica de varianza explicada acumulada del compuesto principal de ICP-MS. d Gráfica de varianza explicada acumulada del compuesto principal de REIMS. e La evaluación del valor k del modelo k-NN basado en la fusión de datos de nivel medio, se probaron valores k entre 1 y 20 para encontrar el parámetro óptimo del clasificador k-NN utilizando diferentes subconjuntos de datos en este estudio. El k óptimo para el clasificador k-NN se eligió como k = 5. f Trazar R2 y Q2 acumulados por componente para el modelo PLS-DA basado en la fusión de datos de nivel medio. Los componentes 1–50 se calcularon para la optimización de parámetros y se determinó que 25 era el número de componente óptimo. g El número de predictores del clasificador de RF influyó en la tasa de clasificación correcta, se probaron npredic 1–200 en cinco grupos para encontrar los mejores parámetros para el clasificador de RF. Se encontró que npredic = 15 es el mejor valor para los clasificadores de RF, según la fusión de datos de nivel medio. h La tasa de clasificación correcta del clasificador de RF estuvo influenciada por la cantidad de árboles, se encontró que Ntree = 500 era el mejor valor para los clasificadores de RF, según la fusión de datos de nivel medio.

La fusión de datos de nivel medio se basó en la reducción de la dimensionalidad de los datos en esta investigación. Los algoritmos de reducción buscan aliviar los problemas asociados con la dimensionalidad al reducir la complejidad de los datos y, por lo tanto, mejorar la calidad de los datos42. Históricamente, PCA ha sido el método más utilizado para la reducción de la dimensionalidad43. Los resultados de PCA de REIMS e ICP-MS se analizaron respectivamente y, posteriormente, se utilizaron PC como técnica de compresión de datos no supervisada para reducir la dimensionalidad al fusionar los dos conjuntos de datos. El número de componentes se determinó examinando la relación de varianza acumulada explicada en función del número de componentes. Los primeros ocho componentes contienen aproximadamente el 85 % de la varianza de los datos de ICP-MS (Fig. 6c), mientras que se necesitarían 226 componentes para retener el 85 % de la varianza de los datos de REIMS (Fig. 6d). La Figura 6b muestra las 234 variables seleccionadas, de las cuales 226 eran del 5500 REIMS y ocho del 20 ICP-MS. Los valores de R2 y Q2 de 1,00 y 0,98 respectivamente indican que el modelo PCA tiene una gran capacidad para explicar las diferencias entre los grupos de salmón. La fusión de datos de nivel medio se consideró una mejor opción para los datos de REIMS e ICP-MS, ya que se descubrió que esto no solo puede reducir el tiempo de procesamiento de datos, sino también mejorar el rendimiento de la predicción de datos y la solidez del modelo.

Para comparar el rendimiento de diferentes algoritmos de clasificación en diferentes estrategias de muestra de entrenamiento de datos, seis modelos metabolómicos, k-vecinos más cercanos (k-NN), PLS-DA, OPLS-DA, LDA, Support Vector Machines (SVM) y Random Forest (RF) se investigaron en busca de combinaciones óptimas de métodos de modelado analítico para identificar el origen geográfico del salmón (Fig. 6e-h). La principal motivación para probar algoritmos de clasificación de varios tipos (lineal/no lineal) fue seleccionar el mejor medio para determinar el país de origen del salmón. Para aumentar la eficiencia informática, se utilizó un conjunto de datos que contenía una fusión de datos de nivel medio.

Para la determinación del origen del salmón (Tabla 3), LDA (Figura complementaria S4a), PLS-DA (Figura complementaria S4b), OPLS-DA (Figura complementaria S4c) y RF (Figura complementaria S4c) obtuvieron una precisión del 100 %. ) modelos. El clasificador SVM proporcionó una alta precisión del 98,6 %. El clasificador con peor rendimiento fue k-NN con una precisión del 85,5 %. Por lo tanto, en el umbral de rendimiento óptimo, la fusión de datos de nivel medio basada en el método de trazabilidad geográfica del salmón logró una tasa de clasificación correcta del 100 % en cuatro tipos de modelos supervisados (LDA, PLS-DA, OPLS-DA y RF), al tiempo que eliminó identificación falsa, en relación con un flujo de trabajo de clasificación convencional. La combinación de los métodos de análisis REIMS e ICP-MS retuvo la mayor parte de la información elemental y de lípidos de las muestras de salmón.

Los modelos desarrollados se aplicaron para evaluar las 17 muestras de salmón minorista descritas anteriormente que se utilizaron para probar los modelos. Los modelos PLS-DA y OPLS-DA obtuvieron una precisión del 100 % en las seis réplicas de todas estas muestras. El clasificador PLS-DA mostró un buen ajuste en este caso, con R2X = 0,92, R2Y = 0,99 y Q2 = 0,97, lo que indica que no estaba sobreajustado y tenía buenas capacidades de predicción. Además, los parámetros del modelo OPLS-DA de R2X, R2Y y Q2 tenían valores de 0,87, 0,97 y 0,96 respectivamente; esto mostró que el modelo tenía un buen ajuste con una predictibilidad aceptable. Mientras que los otros modelos (k-NN, LDA, RF y SVM) no funcionaron tan bien y no se consideraron lo suficientemente confiables para las pruebas de autenticidad del salmón en términos de origen (Tabla 3). El modelo k-NN clasificó las 17 muestras como valores atípicos. Los modelos LDA, RF y SVM también clasificaron erróneamente varias réplicas de siete, dos y dos muestras, respectivamente, en diferentes grupos. Por lo tanto, estos también se consideraron poco confiables para las pruebas de autenticidad del salmón.

El modelo original 3D PLS-DA y OPLS-DA se muestra en la Fig. 7a, c (se usaron 522 muestras para construir los modelos). La buena separación en las parcelas así como los altos índices de clasificación correcta mediante el uso del modelo PLS-DA y OPLS-DA. Dieciséis de las 17 muestras se clasificaron correctamente Fig. 7b, d. Una muestra desconocida con la etiqueta de origen "Noruega y/o Escocia" se clasificó automáticamente en el grupo escocés.

una parcela modelo PLS-DA original creada usando 522 muestras de salmón. b Análisis de autenticidad del origen de la muestra utilizando el modelo PLS-DA (6 replicantes de cada muestra). c Gráfico 3D OPLS-DA original. d El modelo OPLS-DA mostró los resultados de la identificación de la autenticidad del origen del salmón (6 replicantes de cada muestra); 6b y 6d muestran que cuando esta muestra se definió como "Noruega"-grupo azul claro, se clasificó en el grupo amarillo "Escocia".

Las muestras de salmón utilizadas en el estudio procedían de cinco regiones de cultivo de salmón muy importantes; las regiones del Pacífico Norte (Alaska-silvestre) y del Atlántico Norte (Islandia-silvestre y cultivado, Escocia-criado y Noruega-criado). El Océano Pacífico proporciona un hábitat para varias especies de salmón44, cinco especies de salmón se capturan más probablemente en aguas de Alaska (chinook [Oncorhynchus tshawytscha], chum [Oncorhynchus keta], rosado [Oncorhynchus gorbuscha], salmón rojo [Oncorhynchus nerka] y coho [Oncorhynchus Kisutch])45. En el presente estudio se utilizaron muestras de salmón rojo salvaje de Alaska, ya que es la especie de salmón salvaje más común que se vende en el mercado del Reino Unido. El Océano Atlántico tiene solo una especie, Salmo salar, que se obtuvo de Noruega, Islandia y Escocia para este estudio46.

El objetivo de este estudio fue determinar si la combinación de REIMS, ICP-MS, fusión de datos y análisis de datos multivariados podría proporcionar una herramienta poderosa para la autenticación del método de producción y el origen geográfico del salmón. El desempeño de esta combinación única se evaluó mediante el uso de una gran cantidad de muestras de salmón recolectadas con metadatos sólidos y confiables durante dos años (2020-2022). Los datos obtenidos tanto de REIMS como de ICP-MS fueron de calidad suficiente para diferenciar el origen geográfico y el método de producción de estas muestras de salmón. Se encontró que la precisión de la clasificación para diferenciar el salmón salvaje de Alaska, el salmón salvaje de Islandia, el salmón de piscifactoría de Islandia, el salmón de piscifactoría noruego y el salmón de piscifactoría escocés era del 100 % en la validación cruzada con REIMS (Tabla complementaria S2) y del 96,9 % con ICP-MS (Tabla complementaria S3). Sin embargo, utilizando la técnica de validación estándar de oro de análisis no dirigido, las muestras obtenidas de minoristas del Reino Unido fueron un elemento adicional a la validación realizada en el presente estudio, y los datos obtenidos mostraron que una única plataforma solo identificó 14 de las 17 (REIMS) y 11 de las 17 muestras de prueba (ICP-MS) tenían sus orígenes correctamente identificados (Tabla complementaria S4). El estudio se complementó con la aplicación de una fusión de datos de nivel medio y una estrategia de análisis multivariado. Los componentes principales se extrajeron de los datos sin procesar y realizaron una fusión de datos de nivel medio. Se investigó la aplicabilidad de seis modelos quimiométricos (k-NN, LDA, RF, SVM, PLS-DA y OPLS-DA) en el análisis de autenticidad del origen del salmón. Los resultados mostraron que los modelos OPLS-DA y PLS-DA, basados en los datos de REIMS e ICP-MS utilizando fusión de datos de nivel medio, pudieron asignar correctamente la autenticidad en el 100 % de las muestras minoristas. Estas muestras fueron un desafío adicional y real para las pruebas, ya que han pasado por diferentes formas de procesamiento comercial, almacenamiento y empaque.

Se ha demostrado que la fusión de datos es una forma eficaz de reducir el tiempo de procesamiento informático y los recursos necesarios para la clasificación del origen del salmón, al mismo tiempo que minimiza los errores asociados con una gran cantidad de operaciones modelo. Los modelos PCA se utilizaron para extraer y visualizar el contenido de los datos utilizando un protocolo de fusión de datos. En comparación con el modelado de los datos por separado, el enfoque de nivel medio mostró mejoras en el análisis de datos tanto en la eficiencia de la identificación como en la precisión de la clasificación. Por lo tanto, se ha demostrado que un enfoque de espectrometría de masas dual - fusión de datos - análisis multivariante para las pruebas de autenticidad ha dado como resultado la generación de resultados extremadamente fiables que servirán para mejorar la identificación de errores de etiquetado y reducir las disputas entre empresas cuando surjan problemas de autenticidad.

Se obtuvieron un total de 522 muestras de proveedores confiables en cuatro países: 99 de Alaska, 183 de Escocia, 100 de Noruega y 140 de Islandia. Estas muestras de salmón se recolectaron y analizaron en cuatro lotes durante un período de tres años (2020-2022). Las muestras se almacenaron a -18 °C antes del análisis y se descongelaron por completo a temperatura ambiente antes del análisis de la muestra. Se analizaron seis réplicas de cada muestra para ambas plataformas de instrumentos. Se compraron 17 muestras adicionales en supermercados del Reino Unido a fines de mayo de 2022, que se verificaron con los proveedores minoristas y se confirmó la trazabilidad completa de cada una. Según la información de las etiquetas de estas 17 muestras de salmón, 9 eran de Escocia, 7 de Alaska y 1 de Escocia y/o Noruega. La identificación de la muestra y los orígenes de 17 muestras de prueba se enumeran en la Tabla complementaria S4.

En todos los ensayos, se utilizó un generador Erbe VIO50C para la disección electroquirúrgica (Erbe Elektromedizin GmbH, Tuebingen, Alemania). El generador se configuró en modo de "corte automático" con una potencia de salida de 30 W. Se utilizó un tubo ultraflexible de 3 m de largo y 15 mm de diámetro (línea de evacuación/ventilación) para conectar la fuente REIMS a un electroquirúrgico monopolar Erbe 20321-028. cuchillo (Erbe Elektromedizin GmbH, Tubinga, Alemania). Una fuente REIMS de Waters se acopló ortogonalmente al espectrómetro de masas de tiempo de vuelo cuadripolar Waters Xevo G2-XS (Waters, Wilmslow, Manchester, Reino Unido).

El espectrómetro de masas se calibró con una velocidad de flujo de infusión de 20 µl/min de solución de formiato de sodio 0,5 mM (90 % IPA) con una resolución de masa de 15 000 ancho completo a la mitad del máximo (FWHM) a m/z 600 antes del análisis. La polarización del calentador se fijó en 40 voltios y el voltaje del cono se fijó en 60 voltios. El análisis espectrométrico de masas se realizó en modo de sensibilidad y polaridad de iones negativos en un rango de masas de 100–1200 m/z con un tiempo de exploración de 0,5 s/exploración. Enkefalina de leucina (LeuEnk) (m/z 554.2615) (2 ng/µL) en isopropanol (IPA), infundida mediante un sistema Waters Acquity UPLC I-class (Waters, Milford, MA, EE. UU.) a un caudal continuo de 200 µL /min, se establecieron como solución de masa fija para una corrección de masa precisa.

Los datos se adquirieron utilizando MassLynx v4.2 (SCN966 y SCN1010) (Waters, Wilmslow, Manchester, Reino Unido). Los conjuntos de datos sin procesar se analizaron con Abstract Model Builder (AMX) v 1.0.1563.0 (Waters Research Centre, Budapest, Hungría). La matriz procesada generada por el software de modelado de prototipos se exportó a SIMCA 14.1 (Umetrics, Umea, Suecia), donde se sometió a OPLS-DA, con la media de datos centrada y escala de Pareto. Se utilizaron gráficos S y coeficientes frente a VIP para visualizar los resultados predictivos de OPLS-DA. La distinción entre clases se mostrará primero como diferencias en los contenedores de masa, a partir de los cuales se puede determinar la masa precisa de analitos (biomarcadores) que se encuentran dentro de cada contenedor de masa.

Se utilizó agua de alta pureza (18,2 mΩ) de un sistema Milli-Q (Merck-Millipore, Billerica, MA, EE. UU.), peróxido de hidrógeno al 30 % y ácido nítrico al 67–69 % (VWR, Lutterworth, Reino Unido) para la preparación de muestras. Se prepararon soluciones de calibración (HNO3 al 2 % v/v) en el rango de 0,1, 1, 5, 10, 20, 50 y 100 ng/mL a partir de diluciones en serie de 10 μg/mL de soluciones estándar multielemento certificadas 2 y 4 (SPEX , Metuchen, NJ, EE. UU.), y se prepara semanalmente.

Se utilizó el siguiente enfoque para digerir las muestras de salmón: el salmón picado se almacenó en tubos de centrífuga de 50 ml (Sarstedt, Nümbrecht, Alemania) antes de liofilizarlo durante 2 días con un liofilizador Lablyo (Frozen in Time, York, Reino Unido). Se pesó una muestra de salmón de 100 mg y se transfirió a un tubo de polipropileno de 50 ml antes de agregar 2 ml de ácido nítrico al 67–69 %, y la muestra se dejó en una campana extractora para digerir durante al menos 15 h.

Se añadió una alícuota de 2 ml de peróxido de hidrógeno al 30 % a cada muestra antes de la digestión con microondas usando un sistema Mars 6 (CEM, Matthews, NC, EE. temperatura a 54 °C; 5–20 min: mantenido a 54 °C; 20–25 min: 54 °C a 65 °C; 25–35 min: mantenido a 65 °C), las muestras se calentaron progresivamente a 95 °C C. Luego se ajustó la temperatura a 95 °C durante otros 30 min. Después de enfriar, los tubos se llenaron hasta 20 g con 18 mΩ de H2O usando una balanza VWR SE622 (VWR, Lovaina, Alemania).

Las muestras se analizaron con ICP-MS de cuadrupolo simple Agilent 7850 (Modelo 8422A) (Agilent, Singapur) y ICP-MS de triple cuadrupolo Agilent 8900 (Modelo G3665A) (Agilent, Santa Clara, CA, EE. UU.). Se utilizó una bomba peristáltica conectada a un nebulizador Agilent MicroMist y un automuestreador Agilent SPS4 para introducir muestras en el instrumento. Se utilizó el software Agilent ICP-MS MassHunter 5.1 para adquirir datos, que luego se procesaron con el software Agilent Online ICP-MS para crear una matriz de concentraciones elementales.

La precisión se evaluó utilizando un material de referencia estándar en polvo (Material de referencia certificado, RM8414, Canadá), y cada lista de trabajo tenía muestras de control añadidas al principio y al final. Se infundió una solución de Rh de 10 mg/l (utilizada como estándar interno) durante la adquisición de datos y la señal analítica se dividió por la señal del estándar interno mediante procesamiento matemático de datos.

La fusión de datos se relaciona con el proceso de combinar bloques de datos de varias fuentes en un solo modelo global47. En general, los diversos métodos para fusionar datos que se han propuesto en la literatura se clasifican ampliamente en tres estrategias, en función del nivel del flujo analítico de datos en el que se produce la fusión: nivel bajo, nivel medio y nivel alto48, 49.

La estrategia de fusión de datos de bajo nivel implica que las matrices que describen los bloques individuales, después de un procesamiento previo adecuado, se concatenan para construir una matriz única que luego se procesa mediante la técnica quimiométrica deseada50. Los datos de espectrometría de masas adquiridos por REIMS e ICP-MS se exportaron a archivos CSV y se analizaron directamente. La estrategia de nivel medio, la fusión tiene lugar a nivel de características extraídas de varios bloques de datos. Estas características pueden ser variables originales identificadas como relevantes mediante un procedimiento de selección de variables, pero en la mayoría de los casos se utilizan cargas factoriales51,52. Las puntuaciones de PCA se utilizaron para describir la variación significativa de los diferentes bloques en esta investigación. La fusión de datos de alto nivel, operada en el nivel de decisión, no se consideró en este estudio porque no se usa comúnmente.

PCA, una técnica no supervisada, y las técnicas supervisadas k-NN, SVM, RF, LDA, OPLS-DA53 y PLS-DA54 se compararon para evaluar la precisión de la clasificación55. La regresión k-NN calcula la media de los valores de función de sus vecinos más cercanos, y es un método no paramétrico utilizado para clasificación y regresión25. La eficiencia de la clasificación SVM ha sido comprobada en muchos casos de estudio desde que fue inventada por Cortés y Vapnik24. Basado en árboles de decisión, RF usa reglas para dividir datos56. El modelo LDA se basa en la determinación de funciones discriminantes lineales que maximizan la relación de la varianza entre clases y minimizan la relación de la varianza dentro de la clase24. PLS-DA es muy similar a LDA, pero con la reducción de ruido y las ventajas de selección variable de PLS57. LDA y PLS-DA son dos de los métodos de reconocimiento de patrones supervisados más utilizados para el análisis de datos REIMS33. OPLS-DA presenta un filtro de corrección de señal ortogonal integrador para separar las variaciones sistemáticas en los componentes de predicción (correlacionados con Y) y ortogonales (no correlacionados con Y), para explicar la variación entre y dentro de los grupos58. Como una extensión del método de regresión PLS supervisado, los modelos OPLS-DA se han aplicado ampliamente en el análisis de autenticidad de alimentos53.

En todos los casos, el conjunto de datos original se dividió aleatoriamente en conjuntos de entrenamiento y validación. Se utilizó la validación cruzada de cinco veces, dejando fuera 1/5 (20%) de los datos. Entrenamos el modelo con 4/5 (80%) de los datos y lo usamos para predecir las clasificaciones del 20% restante. El proceso se repitió cinco veces, cada vez con una partición diferente predicha por un modelo entrenado con las otras cuatro particiones.

Todo el análisis se realizó utilizando R, con los siguientes paquetes: ggplot2, ggsignif, ggpubr, RColorBrewer, caret, MASS, kknn, Hmisc, randomForest, ropls y kernlab.

Los autores declaran que los datos sin procesar y los datos fuente se proporcionan con este documento. Los conjuntos de datos también se han depositado en Figshare bajo el enlace de acceso https://doi.org/10.6084/m9.figshare.22654477. Los datos que respaldan las gráficas dentro de este documento y otros hallazgos de este estudio también están disponibles a los autores previa solicitud. Los datos de origen se proporcionan con este documento.

El código para los métodos de fusión de datos y análisis multivariante está disponible a los autores con explicaciones detalladas a pedido.

Shahbandeh, M. Industria del salmón: estadísticas y datos | estatista. https://www.statista.com/topics/7411/salmon-industry/#topicHeader__wrapper (2022).

Shamshak, GL, Anderson, JL, Asche, F., Garlock, T. & Love, DCUS consumo de mariscos. J. Mundo Aquac. Soc. 50, 715–727 (2019).

Artículo Google Académico

Asche, F., Sogn-Grundvåg, G., Zhang, D., Cojocaru, AL & Young, JA Marcas, etiquetas y longevidad del producto: el caso del salmón en la venta minorista de comestibles del Reino Unido. J. Int. Alimentos Agribus. Mercado. 33, 53–68 (2021).

Wang, O. & Somogyi, S. Motivos para el consumo de productos del mar de lujo en ciudades de primer nivel en China. Calidad de la comida Preferir. 79, 103780 (2020).

Artículo Google Académico

Oglend, A. & Straume, HM Eficiencia de fijación de precios en los mercados de destino para las exportaciones de salmón noruego. Aquac. economía Administrar 23, 188–203 (2019).

Artículo Google Académico

Asche, F., Misund, B. & Oglend, A. El caso y la causa de la volatilidad del precio del salmón. Aquac. economía Administrar 34, 23–38 (2018).

Google Académico

Houston, RD & Macqueen, DJ Genética del salmón del Atlántico (Salmo salar L.) en el siglo XXI: avances en la acuicultura y la comprensión biológica. Animación Gineta. 50, 3–14 (2019).

Artículo CAS PubMed Google Académico

Flitcroft, RL, Arismendi, I. & Santelmann, MV Una revisión de la investigación de la conectividad del hábitat para el salmón del Pacífico en ambientes marinos, de estuario y de agua dulce. JAWRA J. Am. Recurso de agua. Asoc. 55, 430–441 (2019).

Artículo ANUNCIOS Google Académico

Salazar, L. & Dresdner, J. Integración de mercado y liderazgo de precios: el mercado de salmón del Atlántico de EE. UU. Aquac. economía Administrar 25, 245–259 (2020).

Artículo Google Académico

Zheng, Q., Wang, HH & Lu, Y. Intenciones de compra de los consumidores de salmón silvestre sostenible en el mercado chino e implicaciones para las decisiones de agronegocios. Sostenibilidad 10, 1377 (2018).

Artículo Google Académico

Asche, F., Guttormsen, AG, Sebulonsen, T. y Sissener, EH Competencia entre el salmón de piscifactoría y el salvaje: el mercado del salmón japonés. agricola economía 33, 333–340 (2005).

Artículo Google Académico

Roheim, CA, Sudhakaran, PO y Durham, CA Certificación de camarones y salmón para las mejores prácticas acuícolas: evaluación de las preferencias del consumidor en Rhode Island. Aquac. economía Administrar 16, 266–286 (2012).

Hu, Y., Huang, SY, Hanner, R., Levin, J. & Lu, X. El estudio de productos pesqueros en Metro Vancouver utilizando métodos de códigos de barras de ADN revela un etiquetado fraudulento. Control de Alimentos 94, 38–47 (2018).

Artículo CAS Google Académico

Ebersole, R. Por qué es posible que no obtenga el salmón que pagó. National Geographic https://www.nationalgeographic.com/animals/article/why-you-might-not-be-getting-the-salmon-you-paid-for?cmpid=org=ngp::mc=social:: src=twitter::cmp=editorial::add=tw20220314animals-resurfsalmoncontroversey&linkId=156062383 (2021).

Donlan, CJ & Luque, GM Explorando las causas del fraude de productos del mar: un metanálisis sobre etiquetado incorrecto y precio. Política de marzo 100, 258–264 (2019).

Artículo Google Académico

Cline, E. Sustitución en el mercado de salmón del Atlántico por salmón del Pacífico en el estado de Washington detectada por código de barras de ADN. Alimentos Res. En t. 45, 388–393 (2012).

Artículo CAS Google Académico

Deconinck, D. et al. Identificación y semicuantificación de salmón del Atlántico en productos del mar procesados y mixtos mediante Droplet Digital PCR (ddPCR). Química alimentaria Toxicol. 154, 112329 (2021).

Artículo CAS PubMed Google Académico

Fiorino, GM et al. Evaluación de la autenticidad del pescado mediante análisis directo en espectrometría de masas de alta resolución en tiempo real y análisis multivariado: discriminación entre salmón de cultivo y de tipo salvaje. Alimentos Res. En t. 116, 1258–1265 (2019).

Artículo CAS PubMed Google Académico

Christopher, SJ, Ellisor, DL y Davis, WC Investigación de la viabilidad de ICP-MS/MS para diferenciar los materiales de referencia de salmón del NIST mediante la determinación de las proporciones de isótopos Sr y S. Talanta 231, 122363 (2021).

Artículo CAS PubMed Google Académico

Fu, X. et al. Enfoques de huellas dactilares junto con quimiometría para discriminar el origen geográfico del salmón importado en el mercado de consumo de China. Alimentos 10, 2986 (2021).

Artículo PubMed PubMed Central Google Académico

Chang, WH, Ling, YS, Wang, KC, Nan, FH y Chen, WL Discriminación de los orígenes del salmón del Atlántico utilizando huellas químicas no dirigidas. Química alimentaria 394, 133538 (2022).

Artículo CAS PubMed Google Académico

Ohlberger, J. et al. Efectos no estacionarios e interactivos del clima y la competencia en la productividad del salmón rosado. globo Chang. Biol. 28, 2026-2040 (2022).

Artículo PubMed Google Académico

Canción, G. et al. Método in situ para la discriminación en tiempo real de salmón y trucha arcoíris sin preparación de muestras utilizando iKnife y lipidómica basada en espectrometría de masas de ionización por evaporación rápida. J. Agric. Química alimentaria 67, 4679–4688 (2019).

Artículo CAS PubMed Google Académico

De Graeve, M. et al. Clasificación multivariante versus basada en aprendizaje automático de espectros de espectrometría de masas de ionización evaporativa rápida hacia la especiación de peces a gran escala basada en la industria. Química alimentaria 404, 134632 (2023).

Artículo PubMed Google Académico

Quinn, B. et al. Elementomics combinado con dd-SIMCA y K-NN para identificar el origen geográfico de muestras de arroz de China, India y Vietnam. Química alimentaria 386, 132738 (2022).

Artículo CAS PubMed Google Académico

Liu, HL, Zeng, YT, Zhao, X. & Tong, HR Discriminación del origen geográfico mejorada para el té utilizando técnicas ICP-MS e ICP-OES en combinación con un enfoque quimiométrico. J. Ciencia. Alimentación Agrícola. 100, 3507–3516 (2020).

Artículo CAS PubMed Google Académico

Silva, B. et al. Perfilado elemental por ICP-MS como herramienta para la discriminación geográfica: el caso de la miel de mielada de bracatinga. J. Alimentos Compos. Anal. 96, 103727 (2021).

Artículo CAS Google Académico

Drivelos, SA, Higgins, K., Kalivas, JH, Haroutounian, SA & Georgiou, CA Fusión de datos para autenticación de alimentos. Combinación de elementos de tierras raras y metales traza para discriminar "Fava Santorinis" de otros guisantes partidos amarillos utilizando herramientas quimiométricas. Química alimentaria 165, 316–322 (2014).

Artículo CAS PubMed Google Académico

Schwolow, S., Gerhardt, N., Rohn, S. & Weller, P. Fusión de datos de datos GC-IMS y espectros FT-MIR para la autenticación de aceites de oliva y mieles: ¿vale la pena hacer un esfuerzo adicional? Anal. Bioanal. química 411, 6005–6019 (2019).

Artículo CAS PubMed Google Académico

Marquez , C. , Lopez , MI , Ruisanchez , I. & Callao , MP Estrategia de fusión de datos de espectroscopía FT-Raman y NIR para el análisis cualitativo multivariado del fraude alimentario . Talento 161, 80–86 (2016).

Artículo PubMed Google Académico

Roberto, C. et al. Evaluación de estrategias de fusión de bajo, medio y alto nivel para combinar espectroscopia Raman e infrarroja para la evaluación de la calidad de la carne roja. Química alimentaria 361, 130154 (2021).

Artículo CAS PubMed Google Académico

Ottavian, M., Fasolato, L., Serva, L., Facco, P. y Barolo, M. Fusión de datos para la autenticación de alimentos: discriminación fresca/congelada-descongelada en filetes de pez cabra de África Occidental (Pseudupeneus prayensis). Tecnología de bioprocesos alimentarios. 7, 1025–1036 (2014).

Artículo CAS Google Académico

Negro, C. et al. Un enfoque de perfil metabolómico en tiempo real para detectar el fraude de pescado utilizando espectrometría de masas de ionización evaporativa rápida. Metabolómica 13, 153 (2017).

Artículo PubMed PubMed Central Google Académico

Schymanski, EL et al. Identificación de moléculas pequeñas a través de espectrometría de masas de alta resolución: comunicar confianza. Reinar. ciencia Tecnología 48, 2097–2098 (2014).

Artículo ADS CAS PubMed Google Scholar

Sikveland, M. & Zhang, D. Determinantes de la estructura de capital en la industria acuícola del salmón noruego. Mar. Política 119, 104061 (2020).

Artículo Google Académico

Ytrestøyl, T., Aas, TS & Åsgård, T. Utilización de recursos de alimentación en la producción de salmón del Atlántico (Salmo salar) en Noruega. Acuicultura 448, 365–374 (2015).

Artículo Google Académico

Beheshti Foroutani, M. et al. Reducción al mínimo de los ingredientes marinos en las dietas de salmón del Atlántico (Salmo salar) de cultivo: efectos sobre el rendimiento del crecimiento y la composición de lípidos y ácidos grasos del músculo. PLoS One 13, e0198538 (2018).

Artículo PubMed PubMed Central Google Académico

Betancor, MB et al. Aceite de Camelina sativa transgénica que contiene más del 25 % de AGPI de cadena larga n-3 como principal fuente de lípidos en el alimento para salmón del Atlántico (Salmo salar). Hermano J. Nutr. 119, 1378–1392 (2018).

Artículo CAS PubMed Google Académico

Quigley, KM & van Oppen, MJH Modelos predictivos para la selección de corales térmicamente tolerantes basados en la supervivencia de la descendencia. Nat. común 13, 1–13 (2022).

Artículo Google Académico

Li, C., Zhong, H. & Zhang, W. Un análisis cienciométrico de la literatura reciente sobre bioacumulación y biotransformación de arsénico en ecosistemas marinos. Toro. Reinar. contacto Toxicol. 104, 551–558 (2020).

Artículo CAS PubMed Google Académico

Suhani, I., Sahab, S., Srivastava, V. y Singh, RP Impacto de la contaminación por cadmio en la seguridad alimentaria y la salud humana. actual Opinión Toxicol. 27, 1–7 (2021).

Artículo CAS Google Académico

Anowar, F., Sadaoui, S. & Selim, B. Comparación conceptual y empírica de algoritmos de reducción de dimensionalidad (PCA, KPCA, LDA, MDS, SVD, LLE, ISOMAP, LE, ICA, t-SNE). computar ciencia Rev. 40, 100378 (2021).

Artículo MathSciNet MATEMÁTICAS Google Académico

Becht, E. et al. Reducción de dimensionalidad para visualizar datos de una sola celda usando UMAP. Nat. Biotecnología. 37, 38–44 (2018).

Artículo Google Académico

Oke, KB et al. Las recientes disminuciones en el tamaño del cuerpo del salmón afectan los ecosistemas y las pesquerías. Nat. común 11, 1–13 (2020).

Artículo ANUNCIOS Google Académico

Litzow, MA y col. Relaciones no estacionarias clima-salmón en el Golfo de Alaska. proc. R. Soc. B 285, 20181855 (2018).

Artículo PubMed PubMed Central Google Académico

Gilbey, J. et al. Una línea base de microsatélites para la identificación de poblaciones genéticas de salmón del Atlántico europeo (Salmo salar L.). CIEM J. Mar. Sci. 75, 662–674 (2018).

Artículo Google Académico

Spiteri, M. et al. Fusión de datos entre 1H-NMR de alta resolución y espectrometría de masas: un enfoque sinérgico para la caracterización del origen botánico de la miel. Anal. Bioanal. química 408, 4389–4401 (2016).

Artículo CAS PubMed Google Académico

Borrás, E. et al. Predicción de descriptores sensoriales del aceite de oliva mediante fusión de datos instrumentales y regresión de mínimos cuadrados parciales (PLS). Talanta 155, 116–123 (2016).

Artículo PubMed Google Académico

Castanedo, F. Una revisión de las técnicas de fusión de datos. ciencia Mundo J. 2013, 704504 (2013).

Smilde, AK & Van Mechelen, I. Un marco para la fusión de datos de bajo nivel. Manejo de datos ciencia Tecnología 31, 27–50 (2019).

Artículo Google Académico

Malegori, C. et al. Un enfoque modificado de fusión de datos de nivel medio sobre nariz electrónica y datos FT-NIR para evaluar el efecto de diferentes condiciones de almacenamiento en la vida útil del germen de arroz. Talanta 206, 120208 (2020).

Artículo CAS PubMed Google Académico

Rivera-Pérez, A., Romero-González, R. & Garrido Frenich, A. Aplicación de un enfoque metabolómico innovador para discriminar el origen geográfico y el procesamiento de pimienta negra mediante análisis UHPLC-Q-Orbitrap-HRMS no dirigido y fusión de datos de nivel medio . Alimentos Res. En t. 150, 110722 (2021).

Artículo PubMed Google Académico

Birse, N. et al. La espectrometría de masas ambiental como herramienta para determinar el historial del sistema de producción avícola: una comparación de la espectrometría de masas de ionización por evaporación rápida (REIMS) y las plataformas de espectrometría de masas ambientales de análisis directo en tiempo real (DART). Control de Alimentos 107740, https://doi.org/10.1016/j.foodcont.2020.107740 (2020).

Abu-Rabie, P., Sheelan, D., Laures, A., Spaull, J. y Dowell, S. Aumento del poder de discriminación de la espectrometría de masas de ionización por evaporación rápida (REIMS) en el control analítico de la calidad del tejido y la identificación de muestras de líneas celulares . Comun rápido. espectro de masas. 35, e8525 (2021).

Artículo CAS Google Académico

Jiménez-Carvelo, AM, González-Casado, A., Bagur-González, MG & Cuadros-Rodríguez, L. Métodos alternativos de minería de datos/aprendizaje automático para la evaluación analítica de la calidad y autenticidad de los alimentos: una revisión. Alimentos Res. En t. 122, 25–39 (2019).

Artículo PubMed Google Académico

de Santana, FB, Borges Neto, W. & Poppi, RJ Random forest como clasificador de clase única y espectroscopia infrarroja para la detección de adulteración de alimentos. Química alimentaria 293, 323–332 (2019).

Artículo PubMed Google Académico

Ivorra, E. et al. Detección de salmón ahumado envasado al vacío caducado basado en el método PLS-DA mediante imágenes hiperespectrales. J. Ing. de Alimentos. 117, 342–349 (2013).

Artículo CAS Google Académico

Kang, C. et al. Detección de péptidos cuantitativos específicos de carne de vacuno mediante LC-MS/MS junto con OPLS-DA. Química alimentaria 387, 132932 (2022).

Artículo CAS PubMed Google Académico

Descargar referencias

Los autores desean agradecer a Agilent Corporation por su apoyo a través del premio Agilent Thought Leaders Award. Además, nos gustaría agradecer a Saemunder Sveinsson de Matis Iceland y Mike Mitchell de Fairseas por su apoyo técnico con el proyecto. Este trabajo fue apoyado por EIT Food, la comunidad de innovación en Alimentos del Instituto Europeo de Innovación y Tecnología, un organismo de la Unión Europea, bajo Horizonte 2020, el Programa Marco de Investigación e Innovación de la UE [número de subvención 20118]. El organismo de financiación no tuvo ningún papel en el diseño del estudio; en la recolección, análisis o interpretación de los datos; en la redacción del manuscrito, y en la decisión de enviar el artículo para su publicación. Este estudio también fue apoyado por el Fondo para Profesores de la Cátedra Bualuang ASEAN.

Laboratorio Nacional de Medición: Centro de Excelencia en Agricultura e Integridad Alimentaria, Instituto para la Seguridad Alimentaria Global, Facultad de Ciencias Biológicas, Queen's University Belfast, Belfast, Reino Unido

Yunhe Hong, Nicholas Birse, Brian Quinn, Yicong Li, Wenyang Jia, Philip McCarron, Di Wu, Gonçalo Rosas da Silva, Lynn Vanhaecke & Christopher T. Elliott

Laboratorio de Metabolómica Integrativa, Departamento de Fisiología Traslacional, Infectología y Salud Pública, Facultad de Medicina Veterinaria, Universidad de Ghent, Merelbeke, Bélgica

lynn vanhaecke

Grupo de Calidad y Diseño de Alimentos, Universidad e Investigación de Wageningen, Wageningen, Países Bajos

Saskia van ruth

Escuela de Agricultura y Ciencias de la Alimentación, University College Dublin, Dublín 4, Irlanda

Saskia van ruth

Escuela de Ciencia y Tecnología de Alimentos, Facultad de Ciencia y Tecnología, Universidad de Thammasat, 99 Mhu 18, Pahonyothin Road, Khong Luang, Pathum Thani, 12120, Tailandia

Christopher T. Elliott

También puede buscar este autor en PubMed Google Scholar

Conceptualización del estudio (YH, CE, NB y WJ); supervisión y administración de proyectos (BQ, CE y SR); Diseño experimental (YH, NB y CE); Recogida de muestras (CEDW y NB); Experimentos realizados y análisis de datos (YH, YL, BQ, PM y WJ); redacción—preparación de manuscritos (YH, NB y BQ); redacción: revisión y edición (YH, CE, NB, BQ, GS y LV); Adquisición de financiación (CE y LV). YH y NB contribuyeron igualmente a este estudio como coautores. Todos los autores han leído y aceptado la versión publicada del manuscrito.

Correspondencia a Christopher T. Elliott.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a Chiara Dall'Asta, Sara J. Fraser-Miller y Qing Shen por su contribución a la revisión por pares de este trabajo. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Hong, Y., Birse, N., Quinn, B. et al. Fusión de datos y análisis multivariado para análisis de autenticidad de alimentos. Nat Comun 14, 3309 (2023). https://doi.org/10.1038/s41467-023-38382-z

Descargar cita

Recibido: 06 febrero 2023

Aceptado: 27 de abril de 2023

Publicado: 08 junio 2023

DOI: https://doi.org/10.1038/s41467-023-38382-z

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

Blog

Fusión de datos y análisis multivariado para análisis de autenticidad de alimentos