這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)Python中如何Pandas代碼助數(shù)據(jù)從業(yè)人員開啟新征程,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

為大通等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及大通網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都做網(wǎng)站、網(wǎng)站設(shè)計、大通網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
摘要
Pandas 是基于NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。不少利用Python做數(shù)據(jù)分析的朋友應(yīng)該對Pandas不陌生,這里給大家總結(jié)了20個常用的Pandas代碼幫助大家更快速的理解數(shù)據(jù)。
我這里將這20個Pandas代碼分成三類:
基本數(shù)據(jù)信息
基本數(shù)據(jù)處理
操作Data frames
基本數(shù)據(jù)信息
1、基本讀寫數(shù)據(jù)集(CSV、Execl)
# csv
# 讀
pd.DataFrame.from_csv(“csv_file”)
pd.read_csv(“csv_file”)
# 寫
df.to_csv("data.csv", sep=",", index=False) # 逗號分隔,沒有下標(biāo)
# execl
pd.read_excel("excel_file")
df.to_execl("data.xlsx",sheet_name='a')2、基本數(shù)據(jù)集特征
df.info()
3、基本數(shù)據(jù)統(tǒng)計
df.describe()
4、將data frames輸出到一張表里(tabulate模塊)
from tabulate import tabulate print(tabulate(print_table, headers=headers)) # print_table 為包含列表的列表 # headers 為表頭所包含的字段
5、列出所有的字段
df.columns
6、得到前后n行
df.head(n) #前n行 df.tail(n) #后n行
7、通過特征、位置定位數(shù)據(jù)
df.loc[feature_name] #選擇“size”列的第一行 df.loc([0], ['size']) df.iloc[n] # 位置
基本數(shù)據(jù)處理
8、去除缺失值
df.dropna(axis=0, how='any')
9、替換缺失值
df.replace(to_replace=None, value=None) # 將“to_replace”中的值替換為“value”
10、檢查缺失值
pd.isnull(object) # 檢測缺失值(數(shù)值數(shù)組中的NaN,對象數(shù)組中的None/NaN)
11、刪除一個字段
df.drop('feature_variable_name', axis=1)
# 軸對于行是0,對于列是112、將對象類型轉(zhuǎn)換為數(shù)值
pd.to_numeric(df["feature_name"], errors='coerce') # 將對象類型轉(zhuǎn)換為numeric以便能夠執(zhí)行計算(如果它們是字符串)
13、將Dataframe轉(zhuǎn)換為numpy數(shù)組
df.as_matrix()
操作Data frames
14、將函數(shù)應(yīng)用于dataframe
# 這個將把數(shù)據(jù)的“height”列中的所有值乘以2 1、df["height"].apply(lambda height: 2 * height) 2、def multiply(x): return x * 2 df["height"].apply(multiply)
15、從命名一列
# 這里,將把數(shù)據(jù)的第三列重命名為“size”
df.rename(columns = {df.columns[2]:'size'}, inplace=True)16、獲取某列的唯一項
# 這里將得到列“name”的唯一條目 df["name"].unique()
17、多級訪問
# 在這里,將從數(shù)據(jù)中獲取列的選擇,“name”和“size” new_df = df[["name", "size"]]
18、數(shù)據(jù)的一些統(tǒng)計量df.sum()
df.min() df.max() df.idxmin() df.idxmax() #返回最大值索引 df.mean() df.median() df.corr() # 不同列之間的相關(guān)系數(shù) df["size"].median
19、 數(shù)據(jù)排序
df.sort_values(ascending = False)
20、布爾索引
df[df["size"] == 5] #布爾型索引
上述就是小編為大家分享的Python中如何Pandas代碼助數(shù)據(jù)從業(yè)人員開啟新征程了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
本文題目:Python中如何Pandas代碼助數(shù)據(jù)從業(yè)人員開啟新征程
網(wǎng)站鏈接:http://www.yijiale78.com/article24/gsojje.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供標(biāo)簽優(yōu)化、網(wǎng)站維護(hù)、網(wǎng)站營銷、外貿(mào)網(wǎng)站建設(shè)、手機(jī)網(wǎng)站建設(shè)、電子商務(wù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)