李滕飛 孫東 王平 張曉龍 張譯心 李雷
【摘要】如今多數(shù)文章被文體語法等方面限制,自動生成文章為人們的生活提供便利和創(chuàng)造力,有利于解放固有思想模式,建立多元文化,提高文章的新穎性。
【關(guān)鍵詞】自動生成文章 ?深度學(xué)習(xí) ?大數(shù)據(jù)分析 ?數(shù)學(xué)建模
一、引言
通過大數(shù)據(jù)在數(shù)據(jù)庫中提取各類所需文章進行整理,并在深度學(xué)習(xí)的技術(shù)支持下實現(xiàn)計算機創(chuàng)作出的文章的高質(zhì)量,在如今快節(jié)奏的時代里能夠更多的節(jié)省人們的時間,方便人們的生活。這個項目對于短時間內(nèi)需要一些高質(zhì)量、創(chuàng)新性、廣泛性文章的人們來講是非常的高效而且實用,通過這個項目使需要新文章新思路等需求的工作人群的壓力得到緩解,更好的便民利民。
二、項目實施的意義
(一)從本項目的實際意義
如今我們的生活壓力過大,多數(shù)文章被文體語法等方面限制,在線生成文章可方便人們的生活,具體目的如下:
(1)解決家長的講故事難問題,激發(fā)孩子的想象力與語言表述能力,鍛煉孩子的外語能力。
(2)實時生成最新新聞的過程與評論。
(3)創(chuàng)造出新的文體文風(fēng),擴展文學(xué)領(lǐng)域。
(4)給無創(chuàng)作思路的人群提供素材模板與思想。
(5)生成提供廣告語、主持人臺詞、劇本內(nèi)容、藏頭詩、結(jié)婚請柬等。
(二)從本項目的開發(fā)角度
對素材的收集的過程也是一種學(xué)習(xí),這一過程能對統(tǒng)計的結(jié)果過行簡單的分析,對機器學(xué)習(xí)的過程理解的更加深刻,發(fā)展初步的應(yīng)用意識。對大學(xué)的本科學(xué)生進行專業(yè)技能的綜合訓(xùn)練和實踐,在已經(jīng)學(xué)習(xí)過的各種專業(yè)課程,如:計算機科學(xué)與技術(shù)、程序設(shè)計語言、數(shù)據(jù)庫原理、等專業(yè)課程的基礎(chǔ)之上,進行多門專業(yè)課程的綜合訓(xùn)練和實踐活動,讓學(xué)生在感興趣的情境中,產(chǎn)生統(tǒng)計的需求,探究收集數(shù)據(jù)的方法,感知數(shù)學(xué)和生活的聯(lián)系,對深度學(xué)習(xí)產(chǎn)生認知。
三、問題分析
(1)在眾多文章中能夠篩選出所需文章類型對應(yīng)的素材的問題。
(2)用大數(shù)據(jù)在眾多文章中的選擇問題。
(3)計算機如何對提供的關(guān)鍵字和文體對應(yīng)下的文章迅速整理生成問題。
(4)對文本生成技術(shù)和數(shù)學(xué)方面知識方面的學(xué)習(xí),初步設(shè)計和模型的建立還需要進一步學(xué)習(xí)和了解。
(5)研究用神經(jīng)網(wǎng)絡(luò)來表達單詞的意義和深度學(xué)習(xí)應(yīng)用于自然語言處理的辦法.
四、項目研究內(nèi)容
(一)深度學(xué)習(xí)
機器學(xué)習(xí)包括深度學(xué)習(xí),但是深度學(xué)習(xí)能產(chǎn)生更好的效果,可以讓計算機通過學(xué)習(xí)變得越來越智能。計算機是如何進行學(xué)習(xí)的,是我們重點研究的內(nèi)容。歸根結(jié)底,深度學(xué)習(xí)和機器學(xué)習(xí)都是以數(shù)學(xué)建模為工具,運用深度學(xué)習(xí)的算法分析數(shù)學(xué)模型,對大量數(shù)據(jù)進行分析,計算機從中找出規(guī)律,再把規(guī)律運用到下一次“測試”中。
深度學(xué)習(xí),從字面意義上來看,就是計算機的自我學(xué)習(xí),和人類學(xué)習(xí)語言有一定的相似之處。首先,先理解一下人類學(xué)習(xí)語言的過程。人類在剛開始進行語言學(xué)習(xí)時,接觸的都是一些較為簡單的字詞句,不斷學(xué)習(xí)簡單的字詞,與字詞多次見面后就記住了,再通過簡單的字詞總結(jié)出記憶方法,在簡單字詞的基礎(chǔ)之上進行復(fù)雜字詞的理解與記憶。而深度學(xué)習(xí)的進程,與人類剛開始接觸一門語言的過程有異曲同工之處,計算機要學(xué)習(xí)的是龐大的數(shù)據(jù),通過不斷分析和調(diào)試參數(shù)最終得出無窮逼近結(jié)果的模型。
(二)大數(shù)據(jù)
深度學(xué)習(xí)需要以大數(shù)據(jù)為支撐,在如今科技飛速變革的時代,更需要深度學(xué)習(xí)和大數(shù)據(jù)的緊密結(jié)合。大數(shù)據(jù),顧名思義,就是龐大的數(shù)據(jù)?,F(xiàn)如今我們提到的大數(shù)據(jù),是信息交換、存儲、處理的過程中產(chǎn)生的數(shù)據(jù)。數(shù)據(jù)來源于生活,瀏覽器的搜索引擎、社交網(wǎng)站、購物網(wǎng)站等都會產(chǎn)生眾多數(shù)據(jù)。
五、解決方案
(1)利用互聯(lián)網(wǎng)廣泛收集文章的句式、文體與語法。
(2)通過大數(shù)據(jù)分析將大量高質(zhì)量的文章收集并篩選其精良的部分,利用大數(shù)據(jù)將各類型素材集中。
(3)鉆研計算機模仿人類的語言學(xué)習(xí)行為的運轉(zhuǎn),令機器學(xué)習(xí)整理生成創(chuàng)作出消費者所需類型的文章。
六、結(jié)語
時代飛速發(fā)展,人們的壓力不斷增大,通過計算機的機器學(xué)習(xí)自動生成文章便利了人們的生活。解放固有思想模式,建立多元文化,提高文章的新穎性,激發(fā)孩子的想象力與語言表述能力,緩解新聞媒體編輯者壓力,豐富新聞播出內(nèi)容,開拓新的文學(xué)領(lǐng)域,減小創(chuàng)作者壓力并提供共鳴與靈感,降低廣告商的支出。運用深度學(xué)習(xí)技術(shù)自動生成文章有良好的發(fā)展前景。
參考文獻:
[1][美] 伊恩·古德費洛 / [加]約書亞·本吉奧 / [加] 亞倫·庫維爾.深度學(xué)習(xí).人民郵電出版社.
[2]Thomas H.Cormen / Charles E.Leiserson / Ronald L.Rivest / Clifford Stein.算法導(dǎo)論.機械工業(yè)出版社.
[3]吳軍.數(shù)學(xué)之美.人民郵電出版社.
基金項目:吉林建筑大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項目,項目編號:201910191115 。