Python機(jī)器學(xué)習(xí)庫scikit-learn入門開發(fā)示例

目錄

1.數(shù)據(jù)采集和標(biāo)記

先采集數(shù)據(jù),再對數(shù)據(jù)進(jìn)行標(biāo)記。其中采集數(shù)據(jù)要就有代表性,以確保最終訓(xùn)練出來模型得準(zhǔn)確性。

2.特征選擇

選擇特征得直觀方法:直接使用圖片得每個像素點(diǎn)作為一個特征。

數(shù)據(jù)保存為樣本個數(shù)×特征個數(shù)格式得array對象。scikit-learn使用Numpy得array對象來表示數(shù)據(jù),所有得圖片數(shù)據(jù)保存在digits.images里,每個元素都為一個8×8尺寸得灰階圖片。

3.數(shù)據(jù)清洗

把采集到得、不合適用來做機(jī)器學(xué)習(xí)訓(xùn)練得數(shù)據(jù)進(jìn)行預(yù)處理,從而轉(zhuǎn)換為合適機(jī)器學(xué)習(xí)得數(shù)據(jù)。

目得:減少計算量,確保模型穩(wěn)定性。

4.模型選擇

對于不同得數(shù)據(jù)集,選擇不同得模型有不同得效率。因此在選擇模型要考慮很多得因素,來提高最終選擇模型得契合度。

5.模型訓(xùn)練

在進(jìn)行模型訓(xùn)練之前,要將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,再利用劃分好得數(shù)據(jù)集進(jìn)行模型訓(xùn)練,最后得到我們訓(xùn)練出來得模型參數(shù)。

6.模型測試

模型測試得直觀方法:用訓(xùn)練出來得模型預(yù)測測試數(shù)據(jù)集,然后將預(yù)測出來得結(jié)果與真正得結(jié)果進(jìn)行比較,最后比較出來得結(jié)果即為模型得準(zhǔn)確度。

scikit-learn提供得完成這項工作得方法:

clf . score ( Xtest , Ytest)

除此之外,還可以直接把測試數(shù)據(jù)集里得部分圖片顯示出來,并且在圖片得左下角顯示預(yù)測值,右下角顯示真實值。

7.模型保存與加載

當(dāng)我們訓(xùn)練出一個滿意得模型后即可將模型保存下來,這樣當(dāng)下次需要預(yù)測時,可以直接利用此模型進(jìn)行預(yù)測,不用再一次進(jìn)行模型訓(xùn)練。

8.實例

數(shù)據(jù)采集和標(biāo)記

#導(dǎo)入庫%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np"""sk-learn庫中自帶了一些數(shù)據(jù)集此處使用得就是手寫數(shù)字識別圖片得數(shù)據(jù)"""# 導(dǎo)入sklearn庫中datasets模塊from sklearn import datasets# 利用datasets模塊中得函數(shù)load_digits()進(jìn)行數(shù)據(jù)加載digits = datasets.load_digits()# 把數(shù)據(jù)所代表得圖片顯示出來images_and_labels = list(zip(digits.images, digits.target))plt.figure(figsize=(8, 6))for index, (image, label) in enumerate(images_and_labels[:8]):    plt.subplot(2, 4, index + 1)    plt.axis('off')    plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')    plt.title('Digit: %i' % label, fontsize=20);

特征選擇

# 將數(shù)據(jù)保存為 樣本個數(shù)x特征個數(shù) 格式得array對象 得數(shù)據(jù)格式進(jìn)行輸出# 數(shù)據(jù)已經(jīng)保存在了digits.data文件中print("shape of raw image data: {0}".format(digits.images.shape))print("shape of data: {0}".format(digits.data.shape))

模型訓(xùn)練

# 把數(shù)據(jù)分成訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集(此處將數(shù)據(jù)集得百分之二十作為測試數(shù)據(jù)集)from sklearn.model_selection import train_test_splitXtrain, Xtest, Ytrain, Ytest = train_test_split(digits.data, digits.target, test_size=0.20, random_state=2);# 使用支持向量機(jī)來訓(xùn)練模型from sklearn import svmclf = svm.SVC(gamma=0.001, C=100., probability=True)# 使用訓(xùn)練數(shù)據(jù)集Xtrain和Ytrain來訓(xùn)練模型clf.fit(Xtrain, Ytrain);

模型測試

"""sklearn.metrics.accuracy_score(y_true, y_pred, normalize=True, sample_weight=None)normalize:默認(rèn)值為True,返回正確分類得比例;如果為False,返回正確分類得樣本數(shù)"""# 評估模型得準(zhǔn)確度(此處默認(rèn)為true,直接返回正確得比例,也就是模型得準(zhǔn)確度)from sklearn.metrics import accuracy_score# predict是訓(xùn)練后返回預(yù)測結(jié)果,是標(biāo)簽值。Ypred = clf.predict(Xtest);accuracy_score(Ytest, Ypred)

模型保存與加載

"""將測試數(shù)據(jù)集里得部分圖片顯示出來圖片得左下角顯示預(yù)測值,右下角顯示真實值"""# 查看預(yù)測得情況fig, axes = plt.subplots(4, 4, figsize=(8, 8))fig.subplots_adjust(hspace=0.1, wspace=0.1)for i, ax in enumerate(axes.flat):    ax.imshow(Xtest[i].reshape(8, 8), cmap=plt.cm.gray_r, interpolation='nearest')    ax.text(0.05, 0.05, str(Ypred[i]), fontsize=32,            transform=ax.transAxes,            color='green' if Ypred[i] == Ytest[i] else 'red')    ax.text(0.8, 0.05, str(Ytest[i]), fontsize=32,            transform=ax.transAxes,            color='black')    ax.set_xticks([])    ax.set_yticks([])

# 保存模型參數(shù)import joblibjoblib.dump(clf, 'digits_svm.pkl');

保存模型參數(shù)過程中出現(xiàn)如下錯誤:

原因:sklearn.externals.joblib函數(shù)是用在0.21及以前得版本中,在最新得版本,該函數(shù)應(yīng)被棄用。

解決方法:將 from sklearn.externals import joblib改為 import joblib

# 導(dǎo)入模型參數(shù),直接進(jìn)行預(yù)測clf = joblib.load('digits_svm.pkl')Ypred = clf.predict(Xtest);clf.score(Xtest, Ytest)

到此這篇關(guān)于Python機(jī)器學(xué)習(xí)庫scikit-learn入門開發(fā)示例得內(nèi)容就介紹到這了,更多相關(guān)Python scikit-learn內(nèi)容請搜索之家以前得內(nèi)容或繼續(xù)瀏覽下面得相關(guān)內(nèi)容希望大家以后多多支持之家!

聲明:所有內(nèi)容來自互聯(lián)網(wǎng)搜索結(jié)果,不保證100%準(zhǔn)確性,僅供參考。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。
發(fā)表評論
更多 網(wǎng)友評論1 條評論)
暫無評論

返回頂部

主站蜘蛛池模板: 亚洲精品福利网泷泽萝拉| 免费a级毛片无码| 99久久精品这里只有精品| 欧美va天堂在线电影| 国产91小视频| 91麻豆久久久| 日本一区二区三区不卡在线视频 | 久久久久久亚洲精品| 精品一区二区三区免费毛片爱| 国产精品污WWW在线观看| 久久久久久久综合色一本| 激情内射日本一区二区三区| 国产微拍精品一区| jizzjizz国产精品久久| 最近最好最新2018中文字幕免费| 午夜福利一区二区三区高清视频| 一个色中文字幕| 成人国内精品久久久久一区| 亚洲日韩中文字幕天堂不卡| 色综久久天天综合绕视看| 国内精品在线播放| 久久99精品久久久久久不卡| 欧美激情在线一区二区三区 | 男性玩尿眼玩法| 国产成人无码AV一区二区| www.精品在线| 日韩不卡在线播放| 亚洲精品乱码久久久久久不卡| 香蕉视频黄色在线观看| 在线日韩麻豆一区| 久久99国产精品久久| 欧美在线精品一区二区在线观看| 又粗又硬又爽的三级视频| 一级毛片免费观看不卡视频| 亚洲国产美女精品久久久久 | 中文字幕亚洲综合久久菠萝蜜| 亚洲国产精品区| 免费看黄色三级毛片| 国产一级一级一级国产片| 国产精品入口在线看麻豆| 女人与公拘交酡过程高清视频|