NTM Solutions

Chủ Nhật, 29 tháng 12, 2024

Hướng dẫn cài đặt và sử dụng Jupiter Notebook trong VS Code

Video clip này mình sưu tầm được từ trang VS Code offcial.

Jupiter Notebook là 01 cuốn sổ cho phép ghi chép 03 thứ sau:

  1. Text
  2. Code (chủ yếu là Python) -> có cho chạy và debug luôn!
  3. Visual (là các đồ thị)

p/S: lưu cả kết quả chạy dòng code

Còn đây là câu trả lời của AI Copilot:

Jupyter Notebook là 01 ứng dụng web mã nguồn mở cho phép bạn tạo và chia sẻ tài liệu có chứa mã nguồn, phương trình, văn bản tường thuật và hình ảnh trực quan. Đây là công cụ rất phổ biến trong cộng đồng khoa học dữ liệu và lập trình bởi vì nó hỗ trợ việc lập trình tương tácphân tích dữ liệu theo thời gian thực.


Một số đặc điểm nổi bật của Jupyter Notebook:

- **Hỗ trợ nhiều ngôn ngữ lập trình**: Mặc dù Python là ngôn ngữ được sử dụng nhiều nhất, Jupyter Notebook cũng hỗ trợ các ngôn ngữ khác như R, JuliaScala.

- **Tương tác mạnh mẽ**: Bạn có thể thực hiện và kiểm tra mã từng phần, tạo đồ thị và biểu đồ, tất cả đều trong cùng một tài liệu.

- **Chia sẻ dễ dàng**: Các tệp Jupyter Notebook (đuôi .ipynb) có thể dễ dàng chia sẻ với người khác, cho phép họ thấy cả mã lẫn kết quả thực thi.


Jupyter Notebook thường được sử dụng trong các lĩnh vực như khoa học dữ liệu, học máy, và phân tích dữ liệu vì tính linh hoạt và khả năng tích hợp mạnh mẽ của nó. Nếu bạn chưa thử, đây chắc chắn là một công cụ đáng để khám phá!


Phần tóm tắt của video clip:

🔎 Chapters: 00:00 Install - Cài đặt 00:50 Setting up your environment - Thiết lập môi trường làm việc 02:29 Running text, code and visuals in one notebook - Chạy thử 04:59 Debugging options - Chạy debug 05:22 Variable explorer - Xử lý biến (đa phần là dạng mảng) 06:10 Outro Docs - https://code.visualstudio.com/docs/da... Anaconda installation - https://docs.anaconda.com/anaconda/in...


p/S: nhớ bật phụ đề cho dễ xem.

Timeline

00:12

Cài extension Jupyter Notebook


+ Jupyter Notebook là cuốn sổ ghi chú có kèm code (hay dùng nhất là PY) + vẽ đồ thị


+ menu View - Command pallet - 


+ Nhập "Open Walkthrough" => mở màn hình welcome của VS Code


00:45

Cài extension Python


00:51

trong Command Pallet - Create: new Jupiter Notebook


01:10

connect to a kernel (Python)

Chỗ này nếu chưa có Python -> vào Store cài PY


01:53

Cài đặt Anaconda (là 01 bản phân phối PY dùng cho Machine Learning + Data Science đã bao gồm Jupyter Notebook)

https://docs.anaconda.com/anaconda/install/

Bài thực hành này không cần cài Anaconda (cần 5.2G ổ cứng!!!)


02:09

print("Hello World!")

bấm nút Play (nếu báo phải cài đặt ipykernel thì Install luôn)


Màn hình Notebook xuất ra chữ Hello World! là OK


02:45

Tạo Mark Down: # My First Notebook

Dấu #khoảng trắng để làm chữ to level 01

## là level 02 (chữ nhỏ dần theo level)

Ctr + Alt + Enter là Stop Editing (dấu check )


03:30

Product Analysis


import pandas as pd

data = {
    'Product_ID': range(101, 111),
    'Product_Name': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
    'Category': ['Electronics' , 'Electronics', 'Furniture', 'Furniture', 'Clothing', 'Clothing', 'Food', 'Food', 'Books', 'Books'],
    'Price': [299.99, 199.99, 399.99, 499.99, 59.99, 49.99, 9.99, 14.99, 24.99, 19.99],
    'Stock': [50, 60, 30, 20, 100, 150, 200, 180, 90, 120]
}

df = pd.DataFrame(data)


import matplotlib.pyplot as plt

plt.scatter(df['Price'], df['Stock'])
plt.show()


vào terminal cài 02 thư viện đã import ở trên:

pip install pandas

pip install matplotlib


03:45

sort


04:14

Run cells bằng nhiều cách

-> bấm outline và run section Product Analysis


04:55

Nếu chạy k lỗi gì sẽ xuất ra chart dạng Ball


05:00

Cách debug code + chạy step trong notebook


05:33

Chạy debug cell chứa biến trước

->xem Variables


05:45

+ bấm vào mũi tên trước cột name biến df -> yes

+ Data Wrangler - Install

+ Quay lại bấm phím mũi tên khi nãy -> data lúc này dễ view + analyze hơn (tạo thêm thẻ tab df)

p/S: Data Wrangler có 01 cái nút để xuất 02 dạng dữ liệu sau:

  1. CSV -> mở bằng Excel
  2. Parquet -> dùng pandas và gõ lệnh trong VS Code

import pandas as pd

# Đọc tệp Parquet
df = pd.read_parquet('df.parquet', engine='pyarrow')

# Hiển thị dữ liệu
print(df.head())

Chú ý: file df.parquet mình xuất ra để cùng thư mục với file MyFirstNotebook.ipynb mới k báo lỗi.


Cả 02 dạng dữ liệu trên đều hiển thị mảng df thành dữ liệu dạng cột cho dễ nhìn.


06:27

HẾT


Bạn muốn có file MyFirstNotebook.ipynb thì liên hệ riêng mình.

Nếu vẫn chưa rõ các bạn xem thêm video clip sau của mình:

...


p/S: nếu bị lỗi khi mở file notebook thì báo mình sẽ hỗ trợ !!!


Sau đây là toàn bộ nội dung phần subtitle của video clip trên (bài viết kết thúc ở đây cứ bỏ qua phần này):

VS code supports working with Jupiter


notebooks natively so it's incredibly


seamless to get started in vs code head


over to the extension view search for


Jupiter and install the Jupiter


extension now if this is the first time


you've ever installed the Jupiter


extension you will see a welcome


experience for getting started with


Jupiter notebooks this is a great tool


for walking you through the steps to


create your first notebook and follows


the same workflow that we'll be going


through in this video's demo you can


always navigate back to this welcome


experience exp erience by opening the


command pallet running the open


walkthrough command and selecting the


get started with Jupiter notebooks


option you will also need to install the


python extension which is necessary for


connecting to the python environment


that runs your notebook code this


extension also provides linguage


features like intellisense and syntax


highlighting so let's get started and


create our first notebook in the command


pallet run the create new Jupiter


notebook command this will open a blank


notebook file and you can save open


anded edit this file just like any other


file so let's save it as my first


notebook now there's one more step


before you can start running code in


your notebook and that's connecting to a


kernel the kernel is essentially the


computational engine for executing the


code so in the top right of your


notebook click select a kernel you will


see a drop down in the command pallet to


connect to a python environment or to an


existing Jupiter server select python


environment and if you have python


already installed you will see your


python installation listed now you can


select This Global python environment


but it's recommended to use a virtual


environment instead you can create a


lightweight virtual environment using


Python and we actually have an entire


video about getting started with python


in vs code that talks more about this


Anaconda is also a popular choice for


creating a virtual environment and we


will link to that documentation in the


video description once you have your


virtual environment created you will see


it in your list of python environments


When selecting a kernel so now that we


have a kernel to execute the code let's


run a simple code cell I will write a


basic print hello world and run The Code


by clicking the play icon to the left of


the cell or using the Control Alt Enter


keyboard shortcut if prompted click


install to install the ipy kernel


package which is a lightweight package


necessary for running Jupiter notebooks


in vs code now we have running code in


our notebook and that's all the setup


you need to do so let's explore this


notebook a little more in the top left


of the Jupiter toolbar you can create a


code or markdown cell you will also see


these actions appear if you hover


directly below or above an existing cell


in your notebook each cell has a


language dropdown in the bottom right


corner that you can use to change the


language markdown cells are very helpful


for separating and describing different


sections of code so I can have multiple


section headers and a nested section


that I can collapse for example in the


outline view of the notebook you will


see these markdown headers listed this


outline view allows you to quickly View


and jump to different sections of the


notebook you can think of it like a


table of


contents you can then delete a Cell by


clicking the trash can icon or by


selecting the cell and pressing the


delete key now let's write a little more


code I asked GitHub copilot to generate


a sample data set for me showing


different products and their price and


stock so I'm going to title this section


product analys is in my first code cell


let's first import the pandas package


for the data frame then we can


initialize a data frame given that


co-pilot generated


data then in this next code cell I want


to have some sort of visual in our


notebook so let's import the matte plot


lib package and create a scatter plot


showing the relationship between the


stock and price of the products now as


I'm writing code notice that there's


automatically intelligence as I write so


coding in a note book has virtually the


same experience as coding elsewhere in


the editor another example is that you


can use the go-to definition in a


notebook cell to navigate to a symbol's


definition now that I have these code


cells we've already seen how we can run


a single cell you can also run multiple


cells at once with options like run all


in the toolbar or when focused on a cell


you can either execute all cells above


or execute the cell and all cells below


you can even head to the outline View


and run the cells in a particular


section so there's a lot of flexibility


here depending on your workflow so I


will run these code cells and while it's


running let's take a look at this top


toolbar you can interrupt the running


process and you can also click on go to


which will take you to the currently


running cell once the code is done


running there's a scatter plot generated


right in the notebook so this is a


really cool basic example of how you can


have a mix of text code and visuals all


in one notebook I also wanted to touch


on a couple of options for debugging


cells you can run the code in a Cell


line by


line or you can place a breakpoint and


debug the cell by selecting debug cell


in the Run action menu this will bring


up the full set of debugging features


supported in vs code such as the ability


to step into other cells or to inspect


variables now one final feature I want


to show is the variable Explorer in the


top toolbar click on variables after


executing cells any variables will show


here so you can quickly see their values


certain variables like data frames can


also be visualized in a custom editor


you can click the pop out icon to the


left of the variable name and you will


then be shown recommended extensions for


viewing the data like the data Wrangler


extension if you choose to install that


you will have a really easy way to


further View and analyze your data we


have a video about mastering your data


using data ring anger that will teach


you more about this extension and help


you become a data science Pro in no time


those are the basic components for


getting started with jupyter notebooks


in vs code there's so much more that we


could get into so let us know in the


comments if you'd like to see some more


advanced features and make sure to like


And subscribe to our channel so you


don't miss out on our other videos on


all things vs code happy coding

By #drM

Không có nhận xét nào:

Đăng nhận xét

Facebook Youtube RSS