chore(i18n,learn): processed translations (#45504)
This commit is contained in:
@ -8,13 +8,58 @@ dashedName: demographic-data-analyzer
|
||||
|
||||
# --description--
|
||||
|
||||
在这个挑战中,你必须使用 Pandas 对人口统计进行分析。 你将获得从 1994 年人口普查数据库中提取的人口统计数据数据集。
|
||||
你将通过使用我们的[Replit 入门代码](https://replit.com/github/freeCodeCamp/boilerplate-demographic-data-analyzer)来完成本项目。
|
||||
|
||||
你可以[在 Replit 上查看整个项目的具体描述和初始代码](https://replit.com/github/freeCodeCamp/boilerplate-demographic-data-analyzer)。
|
||||
我们仍在开发 Python 课程的交互式教学部分。 目前,你可以在 YouTube 上通过 freeCodeCamp.org 上传的一些视频学习这个项目相关的知识。
|
||||
|
||||
点击此链接,fork 这个项目。 一旦你根据 “README.md” 中的说明完成项目,请提交你的项目链接到下面。
|
||||
- [Python for Everybody 视频课程](https://www.freecodecamp.org/news/python-for-everybody/)(14 小时)
|
||||
- [Learn Python 视频课程](https://www.freecodecamp.org/news/learn-python-video-course/)(10 小时)
|
||||
|
||||
我们仍在开发 Python 数据分析课程的交互式教学。 现在,你需要使用其他资源来学习如何通过这一挑战。
|
||||
# --instructions--
|
||||
|
||||
在这个挑战中,你必须使用 Pandas 对人口统计进行分析。 你将获得从 1994 年人口普查数据库中提取的人口统计数据数据集。 以下是数据的示例:
|
||||
|
||||
```markdown
|
||||
| | age | workclass | fnlwgt | education | education-num | marital-status | occupation | relationship | race | sex | capital-gain | capital-loss | hours-per-week | native-country | salary |
|
||||
|---:|------:|:-----------------|---------:|:------------|----------------:|:-------------------|:------------------|:---------------|:-------|:-------|---------------:|---------------:|-----------------:|:-----------------|:---------|
|
||||
| 0 | 39 | State-gov | 77516 | Bachelors | 13 | Never-married | Adm-clerical | Not-in-family | White | Male | 2174 | 0 | 40 | United-States | <=50K |
|
||||
| 1 | 50 | Self-emp-not-inc | 83311 | Bachelors | 13 | Married-civ-spouse | Exec-managerial | Husband | White | Male | 0 | 0 | 13 | United-States | <=50K |
|
||||
| 2 | 38 | Private | 215646 | HS-grad | 9 | Divorced | Handlers-cleaners | Not-in-family | White | Male | 0 | 0 | 40 | United-States | <=50K |
|
||||
| 3 | 53 | Private | 234721 | 11th | 7 | Married-civ-spouse | Handlers-cleaners | Husband | Black | Male | 0 | 0 | 40 | United-States | <=50K |
|
||||
| 4 | 28 | Private | 338409 | Bachelors | 13 | Married-civ-spouse | Prof-specialty | Wife | Black | Female | 0 | 0 | 40 | Cuba | <=50K |
|
||||
```
|
||||
|
||||
你必须使用 Pandas 来回答以下问题:
|
||||
|
||||
- 这个数据集中每个种族有多少人? 这应该是一个以种族名称作为索引标签的 Pandas 系列。 (`race` 栏)
|
||||
- 男性的平均年龄是多少?
|
||||
- 拥有学士学位的人的百分比是多少?
|
||||
- 受过高等教育(`Bachelors`, `Masters`, or `Doctorate`)收入超过 50K 的人占多大比例?
|
||||
- 没有受过高等教育的人的收入超过 50K 的比例是多少?
|
||||
- 一个人每周最少工作多少小时?
|
||||
- 每周工作最少小时数的人中有多少人的工资超过 50K?
|
||||
- 哪个国家/地区的收入 >50K 的人口比例最高,该比例是多少?
|
||||
- 确定印度收入 >50K 的人最受欢迎的职业。
|
||||
|
||||
使用文件 `demographic_data_analyzer` 中的启动代码。 更新代码,以便将所有设置为“None”的变量设置为适当的计算或代码。 将所有小数四舍五入到最接近的十分之一。
|
||||
|
||||
单元测试是在 `test_module.py` 下为你编写的。
|
||||
|
||||
## 开发
|
||||
|
||||
对于开发,你可以使用 `main.py` 来测试你的函数。 单击“运行”按钮,`main.py` 将运行。
|
||||
|
||||
## 测试
|
||||
|
||||
为了你的方便,我们将测试从 `test_module.py` 导入到 `main.py`。 只要你点击“运行”按钮,测试就会自动运行。
|
||||
|
||||
## 提交
|
||||
|
||||
复制项目的 URL 并将其提交给 freeCodeCamp。
|
||||
|
||||
## 数据集源
|
||||
|
||||
Dua, D. and Graff, C. (2019). [UCI Machine Learning Repository](http://archive.ics.uci.edu/ml). Irvine, CA: University of California, School of Information and Computer Science.
|
||||
|
||||
# --hints--
|
||||
|
||||
|
@ -8,13 +8,60 @@ dashedName: mean-variance-standard-deviation-calculator
|
||||
|
||||
# --description--
|
||||
|
||||
创建一个函数,这个函数可以使用 Numpy 输出 3 x 3 矩阵的每一行、每一列和所有元素的均值,方差和标准差。
|
||||
你将通过使用我们的[Replit 入门代码](https://replit.com/github/freeCodeCamp/boilerplate-mean-variance-standard-deviation-calculator)来完成本项目。
|
||||
|
||||
你可以在 [Replit](https://replit.com/github/freeCodeCamp/boilerplate-mean-variance-standard-deviation-calculator) 上查看整个项目的具体描述和初始代码。
|
||||
我们仍在开发 Python 课程的交互式教学部分。 目前,你可以在 YouTube 上通过 freeCodeCamp.org 上传的一些视频学习这个项目相关的知识。
|
||||
|
||||
点击此链接,fork 这个项目。 当你根据 “README.md” 中的说明完成了项目,请在下方提交你的项目链接。
|
||||
- [Python for Everybody 视频课程](https://www.freecodecamp.org/news/python-for-everybody/)(14 小时)
|
||||
- [Learn Python 视频课程](https://www.freecodecamp.org/news/learn-python-video-course/)(10 小时)
|
||||
|
||||
我们仍在开发 Python 数据分析课程的交互式教学。 现在,您将需要使用其他资源来学习如何通过这一挑战。
|
||||
# --instructions--
|
||||
|
||||
在 `mean_var_std.py` 中创建一个名为 `calculate()` 的函数,该函数使用 Numpy 输出行、列、和 3 x 3 矩阵中的元素。
|
||||
|
||||
函数的输入应该是一个包含 9 个数字的列表。 该函数应将列表转换为 3 x 3 Numpy 数组,然后返回一个字典,其中包含沿两个轴和展平矩阵的均值、方差、标准差、最大值、最小值和总和。
|
||||
|
||||
返回的字典应遵循以下格式:
|
||||
|
||||
```py
|
||||
{
|
||||
'mean': [axis1, axis2, flattened],
|
||||
'variance': [axis1, axis2, flattened],
|
||||
'standard deviation': [axis1, axis2, flattened],
|
||||
'max': [axis1, axis2, flattened],
|
||||
'min': [axis1, axis2, flattened],
|
||||
'sum': [axis1, axis2, flattened]
|
||||
}
|
||||
```
|
||||
|
||||
如果将包含少于 9 个元素的列表传递给函数,它应该引发 `ValueError` 异常并显示消息:“List must contain nine numbers.” 返回的字典中的值应该是列表而不是 Numpy 数组。
|
||||
|
||||
例如,`calculate([0,1,2,3,4,5,6,7,8])` 应该返回:
|
||||
|
||||
```py
|
||||
{
|
||||
'mean': [[3.0, 4.0, 5.0], [1.0, 4.0, 7.0], 4.0],
|
||||
'variance': [[6.0, 6.0, 6.0], [0.6666666666666666, 0.6666666666666666, 0.6666666666666666], 6.666666666666667],
|
||||
'standard deviation': [[2.449489742783178, 2.449489742783178, 2.449489742783178], [0.816496580927726, 0.816496580927726, 0.816496580927726], 2.581988897471611],
|
||||
'max': [[6, 7, 8], [2, 5, 8], 8],
|
||||
'min': [[0, 1, 2], [0, 3, 6], 0],
|
||||
'sum': [[9, 12, 15], [3, 12, 21], 36]
|
||||
}
|
||||
```
|
||||
|
||||
此项目的单元测试在 `test_module.py` 中。
|
||||
|
||||
## 开发
|
||||
|
||||
对于开发,你可以使用 `main.py` 来测试你的 `calculate()` 函数。 单击“运行”按钮,`main.py` 将运行。
|
||||
|
||||
## 测试
|
||||
|
||||
为了你的方便,我们将测试从 `test_module.py` 导入到 `main.py`。 只要你点击“运行”按钮,测试就会自动运行。
|
||||
|
||||
## 提交
|
||||
|
||||
复制项目的 URL 并将其提交给 freeCodeCamp。
|
||||
|
||||
# --hints--
|
||||
|
||||
|
@ -8,13 +8,70 @@ dashedName: medical-data-visualizer
|
||||
|
||||
# --description--
|
||||
|
||||
在这个项目中,你将要使用 matplotlib,seaborn 和 pandas 来对健康检查数据进行数据可视化和计算。
|
||||
你将通过使用我们的[Replit 入门代码](https://replit.com/github/freeCodeCamp/boilerplate-medical-data-visualizer)来完成本项目。
|
||||
|
||||
你可以[在 Replit 上查看整个项目的具体描述和初始代码](https://replit.com/github/freeCodeCamp/boilerplate-medical-data-visualizer)。
|
||||
我们仍在开发 Python 课程的交互式教学部分。 目前,你可以在 YouTube 上通过 freeCodeCamp.org 上传的一些视频学习这个项目相关的知识。
|
||||
|
||||
打开此链接后,fork 这个项目。 一旦你根据 “README.md” 中的说明完成项目,请提交你的项目到下面的链接。
|
||||
- [Python for Everybody 视频课程](https://www.freecodecamp.org/news/python-for-everybody/)(14 小时)
|
||||
- [Learn Python 视频课程](https://www.freecodecamp.org/news/learn-python-video-course/)(10 小时)
|
||||
|
||||
我们仍在开发 Python 数据分析课程的交互式课程部分。 现在,你需要使用其他资源来学习如何通过这一挑战。
|
||||
# --instructions--
|
||||
|
||||
在本项目中,您将使用 matplotlib、seaborn 和 pandas 来对体检数据进行可视化和计算。 数据集的数值是从体检中收集的。
|
||||
|
||||
## 数据说明
|
||||
|
||||
数据集中的行代表患者,列代表身体测量、各种血液检查的结果和生活方式等信息。 您将使用该数据集来探索心脏病、身体测量数据、血液标志物和对生活方式的选择之间的关系。
|
||||
|
||||
文件名:medical_examination.csv
|
||||
|
||||
| 项目 | 变量类型 | 变量名 | 变量值类型 |
|
||||
|:--------:|:----:|:-----------:|:---------------------:|
|
||||
| 年龄 | 客观特征 | age | int (days) |
|
||||
| 身高 | 客观特征 | height | int (cm) |
|
||||
| 体重 | 客观特征 | weight | float (kg) |
|
||||
| 性别 | 客观特征 | gender | 分类编码 |
|
||||
| 收缩压 | 检测特征 | ap_hi | int |
|
||||
| 舒张压 | 检测特征 | ap_lo | int |
|
||||
| 胆固醇 | 检测特征 | cholesterol | 1:正常,2:高于正常,3:远远高于正常值 |
|
||||
| 血糖值 | 检测特征 | gluc | 1:正常,2:高于正常,3:远远高于正常值 |
|
||||
| 吸烟问题 | 主观特征 | smoke | binary |
|
||||
| 饮酒量 | 主观特征 | alco | binary |
|
||||
| 体育活动 | 主观特征 | active | binary |
|
||||
| 是否有心血管疾病 | 目标变量 | cardio | binary |
|
||||
|
||||
## 任务
|
||||
|
||||
创建一个类似于 `examples/Figure_1.png` 的图表,其中我们显示 `cholesterol`、`gluc`、`alco`、`active` 和 `smoke` 变量,用于不同面板中 heart=1 和 heart=0 的患者。
|
||||
|
||||
在 `medical_data_visualizer.py` 中使用数据完成以下任务:
|
||||
|
||||
- 给数据添加一列 `overweight`。 要确定一个人是否超重,首先通过将他们的体重(公斤)除以他们的身高(米)的平方来计算他们的 BMI。 如果该值 > 25,则此人超重。 使用值 0 表示不超重,使用值 1 表示超重。
|
||||
- 使用 0 表示好的和 1 表示坏,来规范化数据。 如果 `cholesterol` 或 `gluc` 的值为 1,则将值设为 0。 如果值大于 1,则将值设为 1。
|
||||
- 将数据转换为长格式并使用 seaborn 的 `catplot()` 创建一个显示分类特征值计数的图表。 数据集应按“Cardio”拆分,因此每个 `cardio` 值都有一个图表。 该图表应该看起来像 `examples/Figure_1.png`。
|
||||
- 清理数据。 过滤掉以下代表不正确数据的患者段:
|
||||
- 舒张压高于收缩压(使用 `(df['ap_lo'] <= df['ap_hi'])` 保留正确的数据)
|
||||
- 高度小于第 2.5 个百分位数(使用 `(df['height'] >= df['height'].quantile(0.025))` 保留正确的数据)
|
||||
- 身高超过第 97.5 个百分位
|
||||
- 体重小于第 2.5 个百分位
|
||||
- 体重超过第 97.5 个百分位
|
||||
- 使用数据集创建相关矩阵。 使用 seaborn 的 `heatmap()` 绘制相关矩阵。 遮罩上三角。 该图表应类似于 `examples/Figure_2.png`。
|
||||
|
||||
每当变量设置为 `None` 时,请确保将其设置为正确的代码。
|
||||
|
||||
单元测试是在 `test_module.py` 下为你编写的。
|
||||
|
||||
## 开发
|
||||
|
||||
对于开发,你可以使用 `main.py` 来测试你的函数。 单击“运行”按钮,`main.py` 将运行。
|
||||
|
||||
## 测试
|
||||
|
||||
为了你的方便,我们将测试从 `test_module.py` 导入到 `main.py`。 只要你点击“运行”按钮,测试就会自动运行。
|
||||
|
||||
## 提交
|
||||
|
||||
复制项目的 URL 并将其提交给 freeCodeCamp。
|
||||
|
||||
# --hints--
|
||||
|
||||
|
@ -8,13 +8,40 @@ dashedName: page-view-time-series-visualizer
|
||||
|
||||
# --description--
|
||||
|
||||
对于这个项目,你将使用线图、条形图和箱形图对时间序列数据进行可视化。 你将要使用 Pandas、matplotlib 和 seaborn 来对数据集进行可视化,这个数据集包含从 2016-05-09 到 2019-12-03 每一天在 freeCodeCamp.org 论坛的页面访问量。 这个数据可视化将帮助你了解访问的模式,并且显示年增长和月增长情况。
|
||||
你将通过使用我们的[Replit 入门代码](https://replit.com/github/freeCodeCamp/boilerplate-page-view-time-series-visualizer)来完成本项目。
|
||||
|
||||
你可以 [在 Replit 上查看整个项目的具体描述和初始代码](https://replit.com/github/freeCodeCamp/boilerplate-page-view-time-series-visualizer)。
|
||||
我们仍在开发 Python 课程的交互式教学部分。 目前,你可以在 freeCodeCamp.org 的 YouTube 频道中通过视频学习到这个项目相关的所有知识
|
||||
|
||||
点击此链接,fork 这个项目。 一旦你根据 “README.md” 中的说明完成项目,请提交你的项目到下面的链接。
|
||||
- [Python for Everybody 视频课程](https://www.freecodecamp.org/news/python-for-everybody/)(14 小时)
|
||||
- [Learn Python 视频课程](https://www.freecodecamp.org/news/learn-python-video-course/)(10 小时)
|
||||
|
||||
我们仍在开发 Python 数据分析课程的交互式课程部分。 现在,你将需要使用其他资源来学习如何通过这一挑战。
|
||||
# --instructions--
|
||||
|
||||
对于这个项目,你将使用线图、条形图和箱形图对时间序列数据进行可视化。 你将使用 Pandas、Matplotlib 和 Seaborn 可视化包含 2016 年 5 月 9 日至 2019 年 12 月 3 日期间 freeCodeCamp.org 论坛上每天的页面浏览量的数据集。 这个数据可视化将帮助你了解访问的模式,并且显示年增长和月增长情况。
|
||||
|
||||
使用数据完成以下任务:
|
||||
|
||||
- 使用 Pandas 从 “fcc-forum-pageviews.csv” 导入数据。 将索引设置为 “date” 列。
|
||||
- 通过过滤掉页面浏览量位于数据集前 2.5% 或数据集后 2.5% 的日期来清理数据。
|
||||
- 创建一个 `draw_line_plot` 函数,该函数使用 Matplotlib 绘制类似于“examples/Figure_1.png”的折线图。 标题应为“Daily freeCodeCamp Forum Page Views 5/2016-12/2019”。 x 轴上的标签应为“Date”,y 轴上的标签应为“Page Views”。
|
||||
- 创建一个 `draw_bar_plot` 函数,用于绘制类似于“examples/Figure_2.png”的条形图。 它应该显示按年份分组的每个月的平均每日页面浏览量。 图例应显示月份标签并具有“Months”标题。 在图表上,x 轴上的标签应为“Years”,y 轴上的标签应为“Average Page Views”。
|
||||
- 创建一个 `draw_box_plot` 函数,该函数使用 Seaborn 绘制两个相邻的箱形图,类似于“examples/Figure_3.png”。 这些箱线图应显示值在给定年份或月份内的分布情况以及随时间推移的比较情况。 第一个图表的标题应为“Year-wise Box Plot (Trend)”,第二个图表的标题应为“Month-wise Box Plot (Seasonality)”。 确保底部的月份标签从“Jan”开始,并且 x 和 x 轴标记正确。 样板文件包括准备数据的命令。
|
||||
|
||||
对于每个图表,请确保使用数据框的副本。 单元测试是在 `test_module.py` 下为你编写的。
|
||||
|
||||
样板文件还包括保存和返回图像的命令。
|
||||
|
||||
## 开发
|
||||
|
||||
对于开发,你可以使用 `main.py` 来测试你的函数。 单击“运行”按钮,`main.py` 将运行。
|
||||
|
||||
## 测试
|
||||
|
||||
为了你的方便,我们将测试从 `test_module.py` 导入到 `main.py`。 只要你点击“运行”按钮,测试就会自动运行。
|
||||
|
||||
## 提交
|
||||
|
||||
复制项目的 URL 并将其提交给 freeCodeCamp。
|
||||
|
||||
# --hints--
|
||||
|
||||
|
@ -8,13 +8,44 @@ dashedName: sea-level-predictor
|
||||
|
||||
# --description--
|
||||
|
||||
在本项目中,您将分析自 1880 年以来全球平均海平面变化的数据集。 您将使用这些数据来预测到 2050 年的海平面变化。
|
||||
你将通过使用我们的[Replit 入门代码](https://replit.com/github/freeCodeCamp/boilerplate-sea-level-predictor)来完成本项目。
|
||||
|
||||
你可以在 [Replit 上查看整个项目的具体描述和初始代码](https://replit.com/github/freeCodeCamp/boilerplate-sea-level-predictor)。
|
||||
我们仍在开发 Python 课程的交互式教学部分。 目前,你可以在 YouTube 上通过 freeCodeCamp.org 上传的一些视频学习这个项目相关的知识。
|
||||
|
||||
打开此链接后,fork 这个项目。 一旦你根据 “README.md” 中的说明完成项目,请提交你的项目到下面的链接。
|
||||
- [Python for Everybody 视频课程](https://www.freecodecamp.org/news/python-for-everybody/)(14 小时)
|
||||
- [Learn Python 视频课程](https://www.freecodecamp.org/news/learn-python-video-course/)(10 小时)
|
||||
|
||||
# --instructions--
|
||||
|
||||
你将分析自 1880 年以来全球平均海平面变化的数据集。 你将使用这些数据来预测到 2050 年的海平面变化。
|
||||
|
||||
使用数据完成以下任务:
|
||||
|
||||
- 使用 Pandas 从 `epa-sea-level.csv` 导入数据。
|
||||
- 使用 matplotlib 创建散点图,使用“Year”列作为 x 轴,将“CSIRO Adjusted Sea Level”列作为 y 轴。
|
||||
- 使用 `scipy.stats` 中的 `linregress` 函数来获得最佳拟合线的斜率和 y 截距。 在散点图的顶部绘制最佳拟合线。 使线穿过 2050 年以预测 2050 年的海平面上升。
|
||||
- 仅使用数据集中从 2000 年到最近一年的数据绘制一条新的最佳拟合线。 如果上升速度继续与 2000 年一样,则使该线也经过 2050 年以预测 2050 年的海平面上升。
|
||||
- x 标签应为 “Year”,y 标签应为 “Sea Level (inches)”,标题应为 “Rise in Sea Level”。
|
||||
|
||||
单元测试是在 `test_module.py` 下为你编写的。
|
||||
|
||||
样板文件还包括保存和返回图像的命令。
|
||||
|
||||
## 开发
|
||||
|
||||
对于开发,你可以使用 `main.py` 来测试你的函数。 单击“运行”按钮,`main.py` 将运行。
|
||||
|
||||
## 测试
|
||||
|
||||
为了你的方便,我们将测试从 `test_module.py` 导入到 `main.py`。 只要你点击“运行”按钮,测试就会自动运行。
|
||||
|
||||
## 提交
|
||||
|
||||
复制项目的 URL 并将其提交给 freeCodeCamp。
|
||||
|
||||
## 数据源
|
||||
[Global Average Absolute Sea Level Change](https://datahub.io/core/sea-level-rise), 1880-2014 from the US Environmental Protection Agency using data from CSIRO, 2015; NOAA, 2015.
|
||||
|
||||
我们仍在开发 Python 数据分析课程的交互式课程部分。 现在,你需要使用其他资源来学习如何通过这一挑战。
|
||||
|
||||
# --hints--
|
||||
|
||||
|
Reference in New Issue
Block a user