張 恬, 逄金柱, 任發(fā)政, 楊 璐, 王 然, 鄭麗敏, 李依璇,*
(1.中國農(nóng)業(yè)大學 信息與電氣工程學院,北京 100083;2.內(nèi)蒙古蒙牛乳業(yè)(集團)股份有限公司,內(nèi)蒙古 呼和浩特 011500;3.教育部北京市共建功能乳品重點實驗室/中國農(nóng)業(yè)大學 營養(yǎng)與健康系,北京 100190)
嬰幼兒配方粉中的三大營養(yǎng)素包含蛋白質、脂肪和碳水化合物。蛋白質是嬰幼兒生長發(fā)育必需的營養(yǎng)成分,其營養(yǎng)取決于所含各種氨基酸之間的平衡情況[1]。母乳中的氨基酸模式影響了嬰幼兒對于蛋白質的消化和吸收[2]。配方粉的氨基酸組成和比例越接近母乳的氨基酸模式,氨基酸的利用程度越高,才能更好地促進嬰幼兒的消化及健康成長。國外關于母乳氨基酸模式的研究不包括中國的母乳信息[3-4],國內(nèi)針對嬰配粉和母乳氨基酸模式研究缺乏。逄金柱等[5]分析了我國北京(北方)和深圳(南方)兩城市母乳中氨基酸含量的比例差異,段一凡等[6]分析了我國城鄉(xiāng)不同泌乳階段的母乳中氨基酸構成及含量,但是這些研究對母乳氨基酸只進行了組成和含量的分析,并沒有進行系統(tǒng)的氨基酸模式分析。
評價配方粉氨基酸營養(yǎng)價值的方法,主要有生物學法和化學指數(shù)法[7]。生物學法主要通過人體或動物實驗進行相關指標的測定,有較高的準確性和正確性,但是人群試驗和動物實驗的周期長、實驗復雜?;瘜W指數(shù)法主要是對蛋白質中的氨基酸進行分析,可靠性不如生物學法,但是高效、簡單且耗時短,有很高的參考價值。吳慶賀[8]利用皮爾遜相關系數(shù),對3種新型配方粉和母乳的氨基酸模式進行相關性分析,從而判斷出與母乳氨基酸模式最接近的配方粉。宋曉青等[9]在氨基酸曲線相似度計算時,以灰色關聯(lián)度表示氨基酸的平衡度,各個配方粉的氨基酸組成曲線和理想蛋白質氨基酸模式曲線幾何形狀越相似,關聯(lián)度越高,則兩者氨基酸組成越接近,該食物蛋白質的氨基酸平衡性就越好。然而,皮爾遜相關系數(shù)和灰色關聯(lián)法單純從數(shù)理統(tǒng)計角度,評估不同嬰配粉蛋白質的各種必需氨基酸組成數(shù)據(jù)存在的變異程度,沒有將各種氨基酸作為一個整體從向量的角度來度量配方粉和母乳的相似性,存在一定缺陷。
余弦相似度方法在計算機領域有廣泛的應用,如深度學習[10]、多屬性決策[11]、分類預測[12]和推薦系統(tǒng)[13],但是在乳品營養(yǎng)領域的研究較少。本研究收集了母乳樣本1028份,擬將母乳和配方粉的氨基酸信息轉化為矩陣,使用余弦相似度方法從向量的角度比較嬰配粉氨基酸組成與母乳氨基酸組成的相似度,對嬰配粉的營養(yǎng)價值進行評價,希望為嬰配粉的開發(fā)和營養(yǎng)價值研究提供參考。
母乳:針對我國8個城市(北京、濟南、包頭、成都、昆明、深圳、南京、西寧)的240名產(chǎn)婦,年齡為18~38 歲(倫理審查編號 SHERLL2013007),收取其單側乳房的全部乳汁并分裝,縱向采集早期成熟乳6次(產(chǎn)后15~180 d),采集后的母乳于-80 ℃儲藏并通過冷鏈運輸。
配方粉:1段嬰幼兒配方奶粉(0~6月齡)12種(簡稱配方粉),其中包含自主研制的產(chǎn)品6種,市售國產(chǎn)及進口配方粉6種。
鹽酸、苯酚、檸檬酸鈉等為分析純生化試劑,上海網(wǎng)化化工科技有限公司;磺酸型陽離子樹脂購于上海阿拉丁生化科技股份有限公司。
AMINO A300型全自動氨基酸分析儀,德國曼默博爾公司;DHG-9076A型電熱恒溫鼓風干燥箱,上海精宏實驗設備有限公司。
1.3.1母乳及配方粉氨基酸檢測方法
稱取120 mg樣品(蛋白質質量:10~20 mg)放置在水解管中,加入10~15 mL 6 mol/L鹽酸溶液及3~4滴苯酚,并將水解管冷凍35 min,利用真空泵抽真空后充入氮氣,重復該過程3次,保證在充氮狀態(tài)并密封好,放入烘箱內(nèi)(110 ℃)水解22 h,取出冷卻至室溫。將水解液轉移至50 mL容量瓶內(nèi),定容混勻。吸取容量瓶中1.0 mL濾液至試管內(nèi), 45 ℃環(huán)境中減壓干燥,用1~2 mL超純水溶解后進一步減壓干燥后蒸干,加入1~2 mL檸檬酸鈉緩沖液(pH值2.2)振蕩溶解,利用0.22 μm濾膜過濾并轉移至進樣瓶中測定。
氨基酸分析儀的色譜條件:磺酸型鈉離子分離柱,柱溫57 ℃,反應器溫度135 ℃,流動相流速0.45 mL/min,衍生液流速0.25 mL/min。檢測器波長570 nm和440 nm,進樣量50 μL。測得母乳及配方粉各氨基酸值的單位為g/100 g。
1.3.2母乳氨基酸頻數(shù)矩陣優(yōu)化方法
對母乳樣本進行一般統(tǒng)計分析,發(fā)現(xiàn)每個母乳樣本各氨基酸含量之間平均誤差較大,導致母乳整體樣本差異不顯著,但從母乳樣本各氨基酸含量的分布上看,有集中分布的趨勢,因此通過確定大多數(shù)氨基酸含量的分布區(qū)間范圍,以確定母乳氨基酸模式。
計算氨基酸含量的最大值MAXi和最小值MINi,得到極差=MAXi-MINi,根據(jù)MAXi和MINi確定各個氨基酸含量的分布區(qū)間為[MINi,MAXi]。根據(jù)最大值和最小值將氨基酸區(qū)間劃分為N等分(根據(jù)樣本個數(shù)確定N的大小,本實驗母乳樣本數(shù)大于100,小于500,因此,N取值:10≤N≤20),用于分析確定各氨基酸的區(qū)間間隔,每個子區(qū)間間隔如式(1)。
(1)
式(1)中,level為每個子區(qū)間間隔,MAXi為各個氨基酸含量的最大值,MINi為各個氨基酸含量的最小值,N為氨基酸區(qū)間N等分。區(qū)間間隔決定分析控制精度,根據(jù)區(qū)間間隔計算N個子區(qū)間的范圍,每個子區(qū)間范圍如式(2)。
count1:MINi≤x (2) 式(2)中,MAXi為母乳某種氨基酸含量的最大值,MINi為母乳某種氨基酸含量的最小值,level為N等分后的子區(qū)間間隔,countN為每個子區(qū)間。 分別統(tǒng)計每種氨基酸在各子區(qū)間的分布頻數(shù),分布頻數(shù)即氨基酸在該區(qū)間內(nèi)母乳樣本的個數(shù)。得到區(qū)間分布頻數(shù)矩陣(matrix)如式(3)。矩陣中行為M種氨基酸,列為N個子區(qū)間。 (3) 式(3)中,aaMN表示第M種氨基酸含量在countN子區(qū)間中的分布情況。 得到母乳樣本的分布頻數(shù)矩陣,可以了解母乳樣本各氨基酸含量的頻率分布,但需要進一步對分布頻數(shù)矩陣進行優(yōu)化,求解各氨基酸含量的多數(shù)分布區(qū)間,以得到合理的母乳氨基酸模式。采用鐘擺算法進行優(yōu)化,鐘擺算法偽代碼見表1。首先找到母乳分布最多的區(qū)間;分別比較上下兩個區(qū)間的分布數(shù)值,選擇其中的較大者,直至找到連續(xù)的區(qū)間;且連續(xù)區(qū)間的母乳氨基酸種類之和最接近母乳總樣本量的k%[根據(jù)理想標準正態(tài)分布規(guī)律,由標準差σ確定分布的幅度,±1σ分布概率為68.2%,±2σ分布概率為95.4%,但本研究中的母乳樣本不是標準正態(tài)分布,因此取k%母乳樣本數(shù)表示分布概率(68.2%≤k%≤95.4%)]。對早期成熟乳樣本,通過鐘擺算法計算會得到各氨基酸含量的分布區(qū)間,形成新的最小值、最大值和平均值,即為早期成熟乳的母乳氨基酸模式。 表1 鐘擺算法偽代碼 1.3.3配方粉氨基酸和母乳氨基酸的余弦相似度計算方法 1.3.3.1 配方粉和母乳氨基酸數(shù)據(jù)的標準化 標準化是距離計算中最重要的步驟之一。數(shù)據(jù)標準化使各個氨基酸在距離計算過程中具有相同的權重,能夠減少氨基酸數(shù)值范圍變化對距離計算結果的影響。用公式(4)進行標準化。 (4) 式(4)中,x為配方粉或母乳氨基酸的含量,x*為歸一化后配方粉或母乳氨基酸含量,ave為配方粉或母乳氨基酸含量的平均值,std為配方粉或母乳氨基酸含量的標準差。 1.3.3.2 配方粉和母乳氨基酸數(shù)據(jù)的余弦相似度計算 對標準化后的數(shù)據(jù)進行相似度衡量。氨基酸之間的特定比例反映在不同配方粉的具體數(shù)值上,即配方粉相似,對應的每一個氨基酸數(shù)值以及氨基酸之間的比例都相似。傳統(tǒng)的基于數(shù)值的距離度量方法,如歐式距離,忽略了這種特性,只計算了數(shù)值上的差異,而余弦相似度將氨基酸作為一個整體來考慮,因此選擇余弦相似度進行配方粉的相似性度量。余弦相似度的數(shù)值越大,表明相似度越大,余弦相似度計算方法如式(5)。 (5) 式(5)中,d為余弦相似度,Xi為不同配方粉,Yi為母乳氨基酸模式,n為氨基酸種類。 利用Excel 2016軟件進行數(shù)據(jù)整理和統(tǒng)計分析,Origin軟件繪圖可視化,Python 3.7和PyCharm軟件對氨基酸組成進行余弦相似度的計算。 利用全自動氨基酸分析儀測定母乳(顯示部分樣本)和配方粉樣本氨基酸組成和含量,見表2。由表2可見,各母乳中的氨基酸含量存在顯著差異,如賴氨酸質量比為0.076~0.129 g/100 g,蘇氨酸質量比為0.055~0.094 g/100 g,纈氨酸質量比為0.056~0.1 g/100 g等;另外,母乳與配方粉中的氨基酸含量也顯著不同,配方粉中的氨基酸(除精氨酸、脯氨酸、半胱氨酸外)含量比母乳中高。 表2 部分母乳和配方粉中氨基酸的組成和含量 首先對母乳氨基酸進行區(qū)間劃分,確定早期成熟乳中氨基酸含量的最大值和最小值,N等分后確定區(qū)間范圍,以10等分為例,根據(jù)氨基酸含量的最大值和最小值,將區(qū)間分為10份。統(tǒng)計氨基酸在各子區(qū)間的種類,除以氨基酸的總數(shù)得到氨基酸頻數(shù)矩陣,見表3(以必需氨基酸為例)。 表3 必需氨基酸頻數(shù)矩陣 根據(jù)氨基酸的區(qū)間分布情況,結合鐘擺算法,找到分布最多的區(qū)間,分別比較上下兩個區(qū)間的樣本分布情況,選擇較大者(目的是為了確保最終選擇的區(qū)間是連續(xù)的),直至選取的樣本數(shù)趨近總樣本的80%。氨基酸原始區(qū)范圍和處理后的范圍比較情況見表4。優(yōu)化后的母乳氨基酸模式的標準差相較于原始數(shù)據(jù)的標準差變小,說明了優(yōu)化后的氨基酸數(shù)據(jù)更加穩(wěn)定。 表4 氨基酸原始區(qū)范圍和處理后的范圍比較 確定每種氨基酸的80%區(qū)間后,計算氨基酸含量的平均值得到優(yōu)化后母乳氨基酸模式,以WHO母乳氨基酸模式[14]為對照,包括原始母乳氨基酸在內(nèi)的3種氨基酸模式見表5。原始和優(yōu)化后母乳模式與WHO母乳模式相比,氨基酸含量較低,說明中國母乳與WHO母乳氨基酸模式存在顯著差異,評價嬰配粉的營養(yǎng)價值需采用中國母乳氨基酸模式。 表5 各種母乳氨基酸模式 為了驗證區(qū)間處理后母乳氨基酸模式的有效性,比較原始的母乳氨基酸模式、優(yōu)化后的母乳氨基酸模式和WHO母乳氨基酸模式之間的距離。按照式(5)中的余弦相似度比較3種模式的相似性,余弦相似度越大,表明相似性越強,計算結果見表6。相較于原始母乳氨基酸模式,區(qū)間處理后的母乳氨基酸模式和WHO母乳氨基酸模式更相似,驗證了區(qū)間處理確定母乳氨基酸模式的有效性。 表6 母乳氨基酸模式 為了說明必需氨基酸和非必需氨基酸的作用,將母乳樣本分別取9種必需氨基酸和18種全部氨基酸進行比較。針對9種必需氨基酸,計算配方粉與3種母乳氨基酸模式間的余弦相似度,結果見圖1。由圖1可以看出,3種情況下配方粉的排序相似,且相較于原始母乳氨基酸模式,區(qū)間處理后的母乳氨基酸模式和WHO母乳氨基酸模式的結果更接近,說明了優(yōu)化后母乳氨基酸模式更接近WHO母乳氨基酸模式。與母乳相似度最高的均為配方粉F,相似度較低的均為配方粉A。 圖1 針對9種必需氨基酸的配方粉與母乳氨基酸 模式的余弦相似度比較 針對18種全部氨基酸計算配方粉與3種母乳氨基酸模式之間的余弦相似度,結果見圖2。由圖2可以看出,3種情況下配方粉的排序相似,相較于原始母乳氨基酸模式,區(qū)間處理后的母乳氨基酸模式和WHO母乳氨基酸模式的結果更接近,說明了區(qū)間處理后的母乳氨基酸模式更加接近WHO的母乳氨基酸模式。與母乳相似度最高的均為配方粉H和配方粉D,相似度較低的均為配方粉F,這與9種必需氨基酸的分析結果不一致,表明氨基酸的組成不同影響配方粉的氨基酸評價結果。 圖2 針對全部18種氨基酸的配方粉與母乳氨基酸 模式的余弦相似度比較 本研究利用頻數(shù)矩陣優(yōu)化方法提出了新的中國早期成熟乳氨基酸模式,并利用余弦相似度評價方法,將配方粉和新的母乳氨基酸模式進行比較。結果表明,優(yōu)化母乳、原始母乳和WHO母乳氨基酸模式與各配方粉的余弦相似度比較,趨勢一致,說明余弦相似度比較可以客觀評價配方粉的營養(yǎng)價值。針對9種必需氨基酸,配方粉F與母乳相似度較高,配方粉A與母乳相似度較低;針對18種全部氨基酸,配方粉H和配方粉D與母乳相似度較高,配方粉F與母乳相似度較低。不同種氨基酸對比結果表明,氨基酸組成不同影響配方粉的氨基酸評價結果。本研究采用的余弦相似度方法可以用來客觀評價配方粉與中國母乳的氨基酸營養(yǎng)價值,希望為嬰配粉的開發(fā)和應用提供新的評價手段。1.4 數(shù)據(jù)處理
2 結果與分析
2.1 母乳和配方粉樣本中氨基酸組成分析
2.2 母乳氨基酸模式的優(yōu)化結果
2.3 母乳和配方粉氨基酸的余弦相似度分析結果
3 結 論