logo
Văn Khôi Ngô @khoilu95
Hiding within those mounds of data is knowledge that could change the life of a patient, or change the world
605 Followers
2 Followings
1180 Spiders
  • logo

    Cherish_Vu

    Hôm qua
    Chị lên từ năm ngoái rồi cơ e ơi. Ông Việt Anh này lại văn mẫu rồi :))))) Nhớ làm bài review đăng lên Spiderum nha e :p 
    Khi nào rảnh c sẽ lượn qua văn phòng ;)
    1
    logo

    khoilu95

    Hôm qua
    ok chị :))
    1
  • logo

    khoilu95

    Hôm qua
    Chị lên vp đợt trước ạ 😢, đợt này e đang làm đề tài tốt nghiệp ở Spiderum, mà hôm đầu e lên vp cũng được giới thiệu a Trường y như chị =))

    Hm nào rảnh chị lại lên chơi nha :))
    2
  • logo

    khoilu95

    5 tháng 5
    Đây đúng là thực tế đang xảy ra ở xh loài người thời điểm bây giờ. Thanks chủ thớt vì bài viết hay
    2
  • logo

    khoilu95

    27 tháng 3
    Bài viết rất đúng, nhưng k mấy người nhận thức được vấn đề này :))
    1
  • logo

    lololi453

    17 tháng 3
    Cảm ơn anh, bài viết rất hay. Em năm nay 2k3 rồi chuẩn bị vào nghành khoa học dữ liệu ở trường UEF mong anh ra thêm nhiều bài về nghành
    cảm ơn ạ 
    2
    logo

    khoilu95

    18 tháng 3
    ok e :))
    1
  • logo

    trungk18

    16 tháng 3
    Chiếc star duy nhất của repo trên Github là của tôi nhé chủ thớt =))
    1
    logo

    khoilu95

    16 tháng 3
    thanks b nhiều 😢
    1
  • logo

    please

    16 tháng 3
    Thật ra có những use case với Spiderum mà đúng là công nghệ blockchain có lợi thế thật đó em ạ 😃 công nghệ không có lỗi, lỗi là ở người dùng :v
    1
    logo

    khoilu95

    16 tháng 3
    đúng r a, Spiderum là startup chuẩn về tech nên e nghĩ sẽ có đất cho các công nghệ mới ứng dụng vào như blockchain hay recommendation algorithm :))
    2
  • logo

    please

    16 tháng 3
    Haha hay là ICO cho sớm em :)))
    1
    logo

    khoilu95

    16 tháng 3
    ICO tạo ra coin SPID, sau ng viết được thưởng coin theo view vs upvote, cũng được đấy a =)))
    2
  • logo

    khoilu95

    16 tháng 3
    Khi nào Spiderum IPO thì cho e đầu tư từ trứng nước với =))
    1
  • logo

    hkfuoc98

    11 tháng 3
    =)) Mình cũng có tìm hiểu bạn. Mình có đọc qua mấy cuôn kinh điển như Nhà đầu tư thông minh, Cuộc chiến tiền tệ, Marketing căn bản rồi :v nhưng cũng không đam mê lắm. Còn mấy cuốn kỹ năng bán hàng thì tất nhiên phải tránh xa.
    Đọc những cuốn triết học, thiên văn đồ mình lại thấy thú vị. Âu cũng là tùy sở thích mỗi người nữa.
    1
    logo

    khoilu95

    11 tháng 3
    mấy quyển đó là tài chính vs marketing chứ k phải kinh tế học, b đang bị nhầm giữa mấy ngành trong trường kinh tế với nhau, hồi xưa mình cũng thế. B có thể thử lên tiki search về kinh tế học và chọn những quyển như kinh tế học hài hước về đọc thử :))
    2
  • logo

    JokerKid914

    11 tháng 3
    trước ở mức cơ bản em mới dùng thử bs4, html parser để crawl thì bị request time out, mọi người gọi ý em dùng proxy nhưng mà chưa thử qua ạ, anh dùng gì để crawl ạ?
    1
    logo

    khoilu95

    11 tháng 3
    trừ comment ra thì lấy bằng bs4 là được r e, request time out là bị gì a cũng k rõ e thử search gg xem :))
    1
  • logo

    hkfuoc98

    11 tháng 3
    Xin lỗi bạn :v. Mình học KT và thấy nó chán phèo
    1
    logo

    khoilu95

    11 tháng 3
    học trên trường thì chán là đúng r =)), b muốn thấy nó thú vị thì mua mấy quyển sách về kinh tế học trên tiki ấy
    2
  • logo

    JokerKid914

    10 tháng 3
    Hix trước mới học em cũng có ý tưởng crawl tiêu đề ở mỗi mục trên này để phân tích đưa ra xu hướng mà ngặt nỗi em crawl bị hạn chế request ~~ nên em chỉ lấy được số lượng nhỏ các đầu báo...

    😬
    2
    logo

    khoilu95

    10 tháng 3
    hạn chế request là sao e nhỉ :)), a crawl thấy k gặp vấn đề gì 
    1
  • logo

    batmanbegin

    8 tháng 3
    Hóa ra trên nhóm cũng có đồng râm có ý tưởng giống như mình =))) 
    https://datastudio.google.com/embed/reporting/c39ae4a9-b68c-4667-8285-81a140b584a8/page/hztwB
    2
    logo

    khoilu95

    8 tháng 3
    B cấp quyền truy cập mình xem thử phát =)), khoinv.aiesec@gmail.com
    1
  • logo

    batmanbegin

    8 tháng 3
    Mình thấy bạn dùng jupyter. crawl đống này mất bao lâu vậy bạn
    1
    logo

    khoilu95

    8 tháng 3
    Mình dùng google colab nên hơi chậm, cũng phải mất vài ngày
    1
  • logo

    chauyeuBacMaolam

    7 tháng 3
    Cảm ơn tác giả , bài thống kê thật tuyệt vời. Mình đang học về data . Xin phép được hỏi tác giả về kiến trúc của dự án từ đầu tới lúc làm ra những bảng biểu thế này? 
    1
    logo

    khoilu95

    8 tháng 3
    Mình có để file trong Github. Còn kiến trúc thì k có gì ghê gớm vì mình k phải dân chính quy nên làm theo cảm hứng thôi chứ k chuẩn chỉnh lắm =))
    1
  • logo

    Huskywannafly

    8 tháng 3
    Cám ơn bạn đã bỏ công sức để crawl data và làm bài tổng hợp như vậy. Mong là phía Spiderum có thể tận dụng được các insights như thế này để giúp cải thiện sản phẩm tốt lên 😃 Mà công nhận chị gấu SP viết bài đụng trúng chỗ ngứa nên lượt view trung bình cao ngất ngưỡng =))
    Mà data này bạn crawl hết hay là còn xin từ admin nữa thế? 
    2
    logo

    khoilu95

    8 tháng 3
    tự crawl hết a ạ :)), e cũng phân tích vui vui thôi chứ xin data từ admin thì vi phạm tính riêng tư bảo mật quá =))
    1
  • logo

    thaivu164

    7 tháng 3
    Nhìn vào chart top writer thì thấy ngay một điều khá buồn là spiderum bây giờ giống như ngôi nhà riêng của các top writer. Quay đi quay lại cũng chỉ có từng ấy khuôn mặt. Ngồi đoán già đoán non thì có thể đổ lỗi ngay cho cái algorithm. Thiết nghĩ spiderum có thể cải thiện điều này, bài viết mới trên spiderum không nhiều nên hoàn toàn có thể manual selection những bài viết có tiềm năng rồi pin lên top được.
    2
    logo

    khoilu95

    7 tháng 3
    Cũng có nhiều cây viết mới tiềm năng đó bạn, do cách mình visualize data không show cái đó ra :))
    2
  • logo

    nlluong

    7 tháng 3
    Anh nhé 🤣🤣🤣🤣
    2
    logo

    khoilu95

    7 tháng 3
    sr e nhìn tên nên đoán nhầm =))
    2
  • logo

    inrajakha

    6 tháng 3
    Ặc, bài tâm huyết quá. 😃 Cảm ơn bạn đã viết và chia sẻ.

    Mình xin bổ sung thêm một góc nhìn về insight ha, đó là: "insight mang tính cá nhân."

    Cho dù có đọc insight tổng quan như trong bài, thì cái ta có được là người đọc thích gì, tác giả nào mạnh mặt nào,... đại khái như thế. Ta biết nhiều hơn về người khác. Nhưng ta biết gì về ta?

    Đó là lý do, ta cần có insight về bản thân qua các bài viết của mình, có thể dùng một số câu hỏi như:

    1) Bài nào mình cảm thấy thích nhất khi viết?

    2) Bài nào nhiều upvote nhất? Có cái gì hấp dẫn trong bài viết đó?

    3) Bài nào lượt view tăng đều qua năm tháng? 

    (...)

    Mình đặc biệt để ý (1) và (3).

    Khi viết nhiều bài, hẳn người viết sẽ để ý có vài bài viết như một thói quen, hoặc viết như một nhu cầu "xuất hiện đều để người đọc nhớ mình" (gọi là xây dựng thương hiệu cá nhân)... nhưng có một vài bài khác khiến mình viết mà sướng lân lân, flow mấy ngày luôn, thức dậy là mở ngay lap, thậm chí còn giúp mình sáng tỏ một số khúc mắc bấy lâu không giải được. Đó là số (1), là kim chỉ nam để tác giả tìm thấy giọng văn và lĩnh vực mình muốn hướng đến trong tương lai.

    Số (3) là một cái chủ đề thú vị, nó cho thấy 2 điều:

    - Bài viết đó giá trị, được lưu lại, đọc đi đọc lại nhiều lần.

    - Bài viết đó đụng chạm những vấn đề muôn thuở, hẳn là người ta google, bấm vào link, như Việt Anh có nói vấn đề Google Traffic.

    (các bài viết dạng hóng drama sẽ không đạt (1) và (3) mà đạt (2): thỏa mãn số đông, đọc xong quên)

    Ví dụ thực tế luôn, mình có 2 bài, và chỉ 2 bài đó là mình nhắm đến (1) và (3), và có lưu lại thống kê:

    - Bài Cái Tôi và sự cô đơn (29p) (22/12/2019 - 6900 views) (6/3/2021 - 15617 views): 440 ngày, tăng 8717 views
    - Bài Tâm lý học của sự thay đổi bản thân (34p) (6/11/2020 - 9300 views) (6/3/2021 - 13432 views): 121 ngày, tăng 4132 views

    Đó là 2 bài rất dài, đòi hỏi suy tư từ người đọc, mời gọi người đọc cùng suy tư với tác giả và mình cực kỳ thích viết kiểu đi sâu vào vấn đề như vậy.

    Và mình đã lưu lại số view của 2 bài đó khi nó kết thúc 2 tuần trong bảng top tháng. Tức là sau thời gian đó 2 bài coi như biến mất khỏi Spiderum luôn, chỉ lâu lâu xuất hiện ở mục "Phù hợp với bạn" (không có yếu tố tăng views từ các bài top lịch sử vì số upvote không đủ cao).

    ***

    Tựu trung lại, việc có insight về các bài viết của bản thân sẽ giúp chúng ta hiểu rõ hơn ta thích viết cái gì, viết như thế nào; và cái tố chất gì của ta kết nối tốt với người đọc, giúp ta hiểu hơn người đọc của ta.

    Cuối cùng, cũng nên lâu lâu "bỏ hết để được làm người", tự ta làm mới bản thân mình, và người đọc hẳn cũng thích/không thích chuyện đó, nhưng kệ họ. :)) (nhiều người viết tốt bị mắt kẹt bởi vậy, idol làm tù nhân của fan và của chính mình)

    11
    logo

    khoilu95

    7 tháng 3
    Ôi a viết comment cũng hay ý 😢, thanks a đã chia sẻ ạ :))
    1