Định giá bất động sản bằng phân tích hồi quy - Hướng dẫn

Tóm tắt điều hành

Phân tích hồi quy cung cấp một cách tiếp cận khoa học hơn để định giá bất động sản
  • Theo truyền thống, có ba cách tiếp cận để định giá tài sản:doanh số bán, thu nhập và chi phí có thể so sánh được.
  • Mô hình hồi quy cung cấp một giải pháp thay thế linh hoạt và khách quan hơn. Đây cũng là một quá trình mà một khi mô hình được tạo ra, sẽ trở nên tự chủ, cho phép các doanh nhân kinh doanh bất động sản tập trung vào năng lực cốt lõi của họ.
  • Một mô hình có thể được xây dựng với nhiều biến được kiểm tra để xác định tác động đến giá trị của bất động sản, chẳng hạn như diện tích vuông và số lượng phòng ngủ.
  • Các hồi quy không phải là một viên đạn thần kỳ. Luôn có nguy cơ là các biến chứa tự tương quan và / hoặc đa cộng tuyến, hoặc mối tương quan giữa các biến là giả.
Ví dụ:xây dựng mô hình định giá hồi quy cho Hạt Allegheny, Pennsylvania
  • Có rất nhiều thông tin bất động sản có thể được truy cập điện tử để nhập vào các mô hình. Các cơ quan chính phủ, nhà cung cấp dữ liệu chuyên nghiệp và Dịch vụ đa danh sách là ba nguồn như vậy.
  • Các kết xuất dữ liệu ban đầu yêu cầu một số thao tác làm sạch để đảm bảo rằng không có tập hợp thông tin bất thường. Ví dụ:trong mẫu của chúng tôi, những ngôi nhà được chuyển làm quà tặng đã bị loại bỏ để không làm sai lệch kết quả của giá trị thị trường hợp lý.
  • Sử dụng một mẫu ngẫu nhiên từ 10% dữ liệu, SPSS trả về năm biến sau đây là dự đoán tốt nhất cho giá trị bất động sản:
    • Xếp hạng dựa trên chất lượng xây dựng được xếp hạng 1-19 (1 =Rất kém và 19 =Xuất sắc)
    • Khu vực sinh hoạt đã hoàn thiện
    • Điều hòa nhiệt độ (Có / Không)
    • Kích thước Lô đất
    • Hạng cho tình trạng vật chất hoặc tình trạng sửa chữa được xếp hạng 1-8
  • Kiểm tra kết quả là rất quan trọng, với kiểm tra Durbin-Watson được sử dụng để tự tương quan và kiểm tra Breusch-Pagan cho phương sai thay đổi. Trong mô hình của chúng tôi, có một chút khuynh hướng thay đổi thay đổi, điều này cho thấy rằng độ biến thiên của một số biến là không bằng nhau trên toàn bộ các giá trị.
Phân tích bất động sản dựa trên hồi quy có thể hữu ích cho doanh nghiệp của bạn không?
  • Ngoài việc định giá bất động sản, phân tích hồi quy trong bất động sản có thể đặc biệt có lợi trong các lĩnh vực khác:
    • Thử nghiệm trả lại hiệu suất cho các giao dịch trước đây
    • Phân tích định giá để biết giá niêm yết và giá thuê
    • Phân tích nhân khẩu học và tâm lý học của người mua và người thuê nhà ở
    • Xác định các mục tiêu cho tiếp thị trực tiếp
    • Phân tích ROI cho các chiến dịch tiếp thị
  • Ngoài ra, khi đánh giá các ứng viên để xây dựng mô hình hồi quy, hãy cảnh giác với những người hứa hẹn với thế giới ngay từ ngày đầu. Việc xây dựng một mô hình hồi quy mạnh mẽ là một quá trình lặp đi lặp lại, vì vậy thay vào đó hãy tập trung vào những người tò mò bẩm sinh và có thể suy nghĩ tại chỗ (tức là có thể trả lời những câu hỏi liên quan đến não bộ bằng một quá trình suy nghĩ).

Quá thường xuyên trong lĩnh vực bất động sản, quá trình định giá có thể được xem như một bài tập mút ngón tay cái. Người môi giới bất động sản sẽ đến, đá vào lốp xe như câu tục ngữ, và sau đó tạo ra một giá trị ước tính với rất ít cái nhìn sâu sắc về “định lượng”. Có lẽ quá trình này trở nên trầm trọng hơn bởi tình cảm gắn bó mà việc sở hữu bất động sản mang lại vì đối với nhiều người, một ngôi nhà sẽ là khoản đầu tư tài chính lớn nhất trong đời.

Tuy nhiên, có một phương pháp cho sự điên rồ này. Chà, chính xác là ba.

Thuộc tính được định giá như thế nào?

Phương pháp bán hàng so sánh phổ biến nhất trong bất động sản nhà ở và sử dụng doanh số bán các bất động sản tương tự gần đây để xác định giá trị của một tài sản chủ thể. Giá bán của "máy tính" được điều chỉnh dựa trên sự khác biệt giữa chúng và thuộc tính chủ thể. Ví dụ:nếu một cơ sở kinh doanh tương đương có thêm một phòng tắm, thì giá trị ước tính của phòng tắm sẽ được trừ vào giá bán quan sát được của nó.

Bất động sản thương mại được coi là không đồng nhất hơn, vì vậy phương pháp bán hàng so sánh được sử dụng ít thường xuyên hơn. Phương pháp tiếp cận thu nhập, dựa trên khái niệm rằng giá trị nội tại của tài sản tương đương với tổng của tất cả các dòng tiền chiết khấu của nó, được áp dụng phổ biến hơn qua hai phương pháp:

  1. Tương tự như giá trị hiện tại của một niên kim, phương pháp vốn hóa trực tiếp sử dụng thu nhập hoạt động ròng (NOI) của một tài sản chia cho “tỷ lệ giới hạn” để thiết lập giá trị. Tỷ lệ trần bao gồm tỷ lệ chiết khấu ngụ ý và tỷ lệ tăng trưởng trong tương lai của thu nhập hoạt động ròng.
  2. Phương pháp chiết khấu dòng tiền cung cấp giá trị hiện tại của các dòng tiền trong tương lai trong một khoảng thời gian nhất định, với giá trị cuối cùng được ước tính từ việc sử dụng tỷ lệ giới hạn cuối kỳ.

Kỹ thuật cuối cùng là cách tiếp cận chi phí, ước tính giá trị dựa trên chi phí mua một mảnh đất giống hệt nhau và xây dựng một bản sao của tài sản chủ thể. Sau đó, chi phí của dự án được khấu hao dựa trên tình trạng lỗi thời hiện tại của tài sản chủ thể. Tương tự như các điều chỉnh trong cách tiếp cận bán hàng so sánh, mục tiêu là để phù hợp chặt chẽ với tài sản chủ thể. Phương pháp chi phí ít được sử dụng thường xuyên hơn so với hai phương pháp còn lại.

Tất cả các phương pháp định giá bất động sản truyền thống đều mang tính chủ quan, do việc lựa chọn các yếu tố đầu vào được sử dụng để định giá. Ví dụ:việc lựa chọn tỷ lệ giới hạn có tác động đáng kể đến việc định giá tài sản:khi định giá tài sản với NOI là 1 triệu đô la, tỷ lệ giới hạn tăng 4% (từ 6% lên 10%) sẽ làm giảm giá trị của tài sản tăng 40% (Biểu đồ bên dưới).

Lợi ích của Việc Sử dụng Mô hình Hồi quy trong Định giá Bất động sản

Có rất nhiều lợi ích khi sử dụng mô hình hồi quy để định giá bất động sản. Ngành công nghiệp bán lẻ đã chấp nhận việc sử dụng nó để lựa chọn địa điểm, nhưng ngành bất động sản, phần lớn, đã bỏ qua những lợi thế tiềm năng của nó. Phân tích hồi quy đặc biệt thích hợp để phân tích một lượng lớn dữ liệu. Thực tế là không thể có kiến ​​thức vững chắc về mọi thị trường bất động sản địa phương trong nước, nhưng mô hình hồi quy có thể giúp thu hẹp tìm kiếm.

1. Tính linh hoạt

Lợi ích lớn nhất của việc sử dụng mô hình hồi quy là tính linh hoạt vốn có của nó - chúng có thể hoạt động độc lập với các mô hình khác hoặc kết hợp với chúng.

Cách tiếp cận trực tiếp nhất là sử dụng dữ liệu bán hàng hiện có để dự đoán giá trị của thuộc tính chủ thể, làm đầu ra cho mô hình. Có rất nhiều nguồn dữ liệu miễn phí từ các cơ quan địa phương, tiểu bang và liên bang có thể được bổ sung bằng các nhà cung cấp dữ liệu tư nhân.

Một lựa chọn khác là sử dụng các mô hình hồi quy để dự đoán chính xác hơn các yếu tố đầu vào cho các phương pháp định giá truyền thống khác. Ví dụ:khi phân tích một dự án thương mại hỗn hợp, nhà phát triển có thể xây dựng một mô hình để dự đoán doanh thu trên mỗi foot vuông cho không gian bán lẻ và một mô hình khác để dự đoán giá thuê cho thành phần dân cư. Sau đó, cả hai điều này có thể được sử dụng làm đầu vào cho phương pháp tiếp cận thu nhập để định giá.

2. Phương pháp tiếp cận mục tiêu

Sử dụng các nguyên tắc thống kê hợp lý mang lại một cách tiếp cận khách quan hơn để định giá. Đó là một trong những cách tốt nhất để tránh thiên vị xác nhận, xảy ra khi mọi người tìm kiếm thông tin xác nhận quan điểm hiện có của họ hoặc từ chối thông tin mới mâu thuẫn với nó. Khi tôi đã xây dựng các mô hình cho các nhà bán lẻ để dự đoán doanh số cửa hàng mới, họ thường ngạc nhiên khi biết rằng nhiều nhà bán lẻ được lợi khi ở gần đối thủ cạnh tranh. Trên thực tế, vị trí với Walmart, người thường là đối thủ cạnh tranh lớn nhất của họ, là một trong những biến số phổ biến nhất được sử dụng trong các mô hình của tôi. Dựa vào những thành kiến ​​hiện có có thể dẫn đến việc bỏ lỡ những cơ hội, hoặc thậm chí tệ hơn là che giấu những thảm họa ngay bên cạnh.

Một số lợi thế khách quan của định giá thống kê là:

  1. Phân tích thống kê cho phép bạn xác định ý nghĩa thống kê (độ tin cậy) của các yếu tố riêng lẻ trong mô hình.
  2. Mặc dù phân tích kịch bản hoặc độ nhạy có thể cung cấp cho bạn ý tưởng chung về những thay đổi đối với đầu vào theo các phương pháp truyền thống hơn, nhưng nó giống với việc đưa ra nhiều dự đoán hơn là cung cấp cho bạn ý tưởng tốt hơn về độ chính xác của dự đoán ban đầu. Mặt khác, khi xây dựng mô hình hồi quy, bạn sẽ biết phạm vi kết quả dựa trên mức độ tin cậy nhất định.

Mô hình hồi quy là duy nhất trong thực tế là chúng được tích hợp sẵn tính năng kiểm tra độ chính xác. Sau khi xây dựng mô hình trên một mẫu của tổng dân số, bạn có thể sử dụng mô hình trên dữ liệu ngoài mẫu để phát hiện sai lệch lấy mẫu có thể có.

3. Bám sát năng lực cốt lõi của bạn

Các phương pháp định giá truyền thống đều có rủi ro sai lệch lựa chọn đáng kể. Khi chọn các thuộc tính có thể so sánh được, bạn rất dễ rơi vào bẫy chọn các kết quả tốt nhất và cho rằng chúng giống với dự án của bạn nhất. Ngoài ra còn có sự nhấn mạnh vào việc dự đoán các biến số, chẳng hạn như tỷ lệ lợi nhuận trong cách tiếp cận thu nhập. Việc loại bỏ nhu cầu dự đoán này có thể hấp dẫn nhiều nhà đầu tư bất động sản, đó là lý do tại sao định giá dựa trên hồi quy là một cách tiếp cận hữu ích.

Các vấn đề có thể xảy ra với phân tích hồi quy

Số lượng câu chuyện cười trích dẫn tỷ lệ phần trăm khác nhau của thống kê được tạo thành thực sự là một trò đùa. Hầu như ngày nào chúng ta cũng bị các phương tiện truyền thông đưa tin rầm rộ về kết quả của một nghiên cứu mới, nhiều trong số đó dường như mâu thuẫn với một nghiên cứu được công bố vào năm ngoái. Trong một thế giới của những kẻ khó hiểu, không có thời gian để thảo luận về mức độ nghiêm ngặt của các phương pháp mà các nhà nghiên cứu sử dụng.

Có nhiều loại phân tích hồi quy, nhưng phổ biến nhất là hồi quy tuyến tính. Có một số giả định nhất định về hồi quy tuyến tính không được vi phạm để coi mô hình là hợp lệ. Việc vi phạm các giả định này sẽ làm sai lệch các thử nghiệm thống kê tính toán sức mạnh dự đoán của các yếu tố đầu vào và mô hình tổng thể.

Các giả định hồi quy tuyến tính

Cần có mối quan hệ tuyến tính giữa các yếu tố đầu vào (biến độc lập) và đầu ra (biến phụ thuộc). Ví dụ, chúng ta có thể giả định rằng có một mối quan hệ tuyến tính giữa bộ vuông nóng trong một ngôi nhà và giá trị tổng thể của nó. Tuy nhiên, do lợi nhuận giảm dần, chúng tôi có thể phát hiện ra rằng mối quan hệ này là phi tuyến tính, đòi hỏi phải chuyển đổi dữ liệu thô.

Các biến độc lập không được ngẫu nhiên. Nói một cách đơn giản, các quan sát cho mỗi biến độc lập trong mô hình là cố định và được giả định là không có sai số trong phép đo của chúng. Ví dụ:nếu chúng tôi đang sử dụng số lượng đơn vị để lập mô hình giá trị của một tòa nhà chung cư, thì tất cả các tòa nhà trong dữ liệu mẫu của chúng tôi sẽ có một số đơn vị cố định không thay đổi, bất kể chúng tôi xây dựng mô hình như thế nào.

"Phần còn lại" của mô hình (tức là sự khác biệt giữa kết quả dự đoán của mô hình và các quan sát thực tế) sẽ tổng bằng 0 hoặc nói một cách đơn giản hơn:mô hình chúng tôi sẽ sử dụng sẽ đại diện cho dòng phù hợp nhất.

Mô hình phải chính xác cho tất cả các quan sát cho mỗi biến độc lập. Nếu chúng tôi dự đoán giá trị của một ngôi nhà dựa trên diện tích vuông của nó, chúng tôi sẽ không muốn sử dụng mô hình nếu nó cực kỳ chính xác trong việc dự đoán giá trị cho những ngôi nhà dưới 1.500 mét vuông, nhưng có một lượng lớn sai số đối với những ngôi nhà trên 3.000 thước vuông. Điều này được gọi là phương sai thay đổi.

Một trong những vấn đề phổ biến nhất đối với hồi quy tuyến tính khi nhìn vào ngành bất động sản là mối tương quan của sai số dư giữa các lần quan sát. Bạn có thể coi đây là nhiễu trắng không có khuôn mẫu. Tuy nhiên, nếu có một mô hình đối với phần còn lại, thì rất có thể chúng ta cần phải thực hiện điều chỉnh. Vấn đề này rất khó để khái niệm hóa, nhưng có hai lĩnh vực chính mà đây là mối quan tâm trong ngành bất động sản.

1. Tự tương quan

Việc xây dựng một mô hình dựa trên các quan sát trong một khoảng thời gian dài sẽ không thích hợp để dự đoán các giá trị hiện tại. Giả sử chúng ta đã xây dựng một mô hình để dự đoán giá trị của bất động sản khách sạn bằng cách sử dụng giá phòng trung bình như một biến độc lập. Khả năng dự đoán của biến này có thể bị sai lệch vì giá phòng đã tăng liên tục theo thời gian. Về mặt thống kê, có sự tự tương quan giữa giá phòng trung bình quan sát được cho thấy xu hướng tích cực theo thời gian (tức là lạm phát) sẽ không được tính đến trong mô hình. Phương pháp bán hàng so sánh truyền thống được sử dụng rộng rãi nhất trong bất động sản nhà ở giúp loại bỏ vấn đề này bằng cách chỉ sử dụng dữ liệu gần đây nhất. Vì số lượng giao dịch thương mại ít hơn rất nhiều, giới hạn thời gian này thường làm cho phương pháp bán hàng có thể so sánh không hiệu quả. Tuy nhiên, có những kỹ thuật sử dụng hồi quy tuyến tính có thể khắc phục được các vấn đề của tự tương quan.

Hiệu ứng cụm cũng là một thách thức đáng kể trong việc lập mô hình định giá bất động sản. Điều này có thể được coi là tự tương quan không gian. Cách đơn giản nhất để giải quyết vấn đề này là hình dung việc xây dựng một mô hình dự đoán giá trị của những ngôi nhà ở hai khu phố (A và B) ở hai bên đường cao tốc. Nhìn chung, mô hình có thể hoạt động tốt trong việc dự đoán các giá trị, nhưng khi chúng tôi kiểm tra các lỗi còn lại, chúng tôi nhận thấy có một mô hình. Những ngôi nhà ở khu phố A thường được định giá cao hơn khoảng 10%, và những ngôi nhà ở khu phố B được định giá thấp hơn khoảng 10%. Để cải thiện mô hình của mình, chúng tôi cần tính đến hiệu ứng cụm này hoặc xây dựng một mô hình cho mỗi vùng lân cận.

2. Đa cộng tuyến

Lý tưởng nhất là các biến trong mô hình sẽ không tương quan với nhau. Vấn đề này được gọi là đa cộng tuyến. Sử dụng cả bộ vuông và số lượng điểm đỗ xe làm đầu vào cho một mô hình đánh giá các trung tâm thương mại trong khu vực có thể sẽ chứng tỏ sự đa cộng tuyến. Điều này là trực quan vì các mã quy hoạch thường yêu cầu một số điểm đỗ xe nhất định dựa trên diện tích mặt bằng của một không gian thương mại. Trong ví dụ này, việc loại bỏ một trong các biến sẽ đưa ra đánh giá chính xác hơn về mô hình đã điều chỉnh mà không làm giảm đáng kể khả năng dự đoán của nó.

Các cân nhắc khác

Sử dụng dữ liệu quan sát là cốt lõi của bất kỳ phương pháp tiếp cận thực nghiệm nào, nhưng điều quan trọng cần nhớ là các kết quả trong quá khứ không phải lúc nào cũng dự đoán được tương lai. Các tài sản kém thanh khoản như bất động sản đặc biệt dễ bị ảnh hưởng bởi những thay đổi trong chu kỳ kinh doanh. Khả năng dự đoán đối với một số biến số nhất định có thể thay đổi dựa trên các điều kiện kinh tế hiện tại. Vấn đề này không phải là duy nhất đối với hồi quy tuyến tính và cũng được tìm thấy với các cách tiếp cận truyền thống.

Tương quan không phải là nhân quả bình đẳng. Mục đích của việc xây dựng mô hình là tìm ra các biến hữu ích sẽ đưa ra các dự đoán hợp lệ. Bạn phải cảnh giác với các mối tương quan giả mạo. Bạn có thể ngạc nhiên khi biết rằng có một mối tương quan cực kỳ chặt chẽ giữa tỷ lệ ly hôn ở Maine và mức tiêu thụ bơ thực vật trên đầu người. Tuy nhiên, sử dụng dữ liệu ly hôn từ Maine sẽ không hợp lý nếu bạn đang cố gắng dự đoán doanh số bán bơ thực vật trong tương lai.

Một ví dụ thực tế về Định giá Bất động sản qua Hồi quy

Bây giờ chúng ta hãy áp dụng kiến ​​thức này một cách thực tế và xây dựng một mô hình tuyến tính từ đầu đến cuối. Đối với ví dụ của chúng tôi, chúng tôi sẽ cố gắng xây dựng một mô hình định giá bất động sản dự đoán giá trị của những ngôi nhà biệt lập dành cho một gia đình ở Quận Alleghany, Pennsylvania. Việc lựa chọn Quận Alleghany là tùy ý, và các hiệu trưởng được chứng minh sẽ phù hợp với bất kỳ địa điểm nào. Chúng tôi sẽ sử dụng Excel và SPSS, đây là một phần mềm thống kê được sử dụng phổ biến.

Tìm dữ liệu

Tìm kiếm dữ liệu chất lượng là bước đầu tiên trong việc xây dựng một mô hình chính xác và có lẽ là quan trọng nhất. Mặc dù tất cả chúng ta đều đã nghe đến cụm từ “rác vào, bỏ rác ra ngoài”, nhưng điều quan trọng cần nhớ là không có tập dữ liệu hoàn hảo. Điều này là tốt miễn là chúng ta có thể thoải mái cho rằng dữ liệu mẫu là đại diện cho toàn bộ dân số. Có ba nguồn dữ liệu bất động sản chính:

  1. Nguồn dữ liệu đầu tiên và thường tốt nhất đến từ các cơ quan chính phủ. Phần lớn dữ liệu này là miễn phí hoặc chi phí tương đối thấp. Nhiều công ty sẽ tính phí dữ liệu mà bạn có thể dễ dàng nhận được miễn phí, vì vậy hãy luôn xem nhanh trên internet trước khi mua dữ liệu. Tìm kiếm trên web thường sẽ mang lại kết quả bằng cách tìm kiếm quận hoặc thành phố mà bạn đang tìm kiếm và các từ như “người định thuế”, “thẩm định thuế”, “hồ sơ bất động sản” hoặc “tìm kiếm chứng thư”. Bộ phận Hệ thống Thông tin Địa lý (GIS) là một trong những bộ phận bị nhiều cộng đồng bỏ qua nhất. Họ thường có nhiều dữ liệu được tổng hợp từ nhiều cơ quan địa phương khác. Là một nhà phát triển bất động sản, tôi thường nhờ đến sự trợ giúp của họ để tìm dữ liệu chất lượng cao mà tôi đã sử dụng để xây dựng mô hình giúp xác định vị trí các bất động sản mới để phát triển. Các tổ chức phát triển kinh tế cũng có thể là một nguồn dữ liệu tuyệt vời.
  2. Các nhà cung cấp vì lợi nhuận là một lựa chọn khác. Chúng đặc biệt hữu ích khi bạn đang tìm kiếm dữ liệu trên nhiều lĩnh vực. Hãy chắc chắn rằng bạn làm bài tập về nhà trước khi trả một số tiền lớn cho dữ liệu của họ. Đừng chỉ dựa vào các tập dữ liệu mẫu của họ, vì nó có thể gây hiểu lầm về mức độ đầy đủ. Nếu bạn nghi ngờ về dữ liệu mà họ có sẵn, hãy liên hệ trực tiếp với đại diện hoặc hỏi về đảm bảo hoàn tiền.
  3. Cuối cùng, Dịch vụ Đa danh sách cục bộ (MLS) là một nguồn tài nguyên vô giá. Hầu hết các bất động sản được tiếp thị thông qua một đại lý bất động sản là thành viên của MLS. Nói chung, các thành viên của MLS được yêu cầu đưa tất cả danh sách của họ vào hệ thống cục bộ. Thật không may, thường có nhiều hạn chế khi tham gia MLS và chi phí truy cập dữ liệu có thể khá cao. Điều quan trọng nữa là đảm bảo bạn không vi phạm các điều khoản dịch vụ khi sử dụng dữ liệu của họ và tự chịu trách nhiệm pháp lý.

Chúng tôi sẽ độc quyền sử dụng dữ liệu miễn phí cho ví dụ của mình, lấy từ Trung tâm Dữ liệu Khu vực Tây Pennsylvania và Cục Điều tra Dân số Hoa Kỳ. Dữ liệu Bán hàng Bất động sản của Alleghany sẽ cung cấp cho chúng tôi một tệp cơ sở để quan sát chúng tôi với giá bán là biến phụ thuộc của chúng tôi (biến Y). Chúng tôi cũng sẽ kiểm tra các biến bằng cách sử dụng điểm đi bộ cho mỗi đường điều tra dân số và thông tin thẩm định thuế.

Một biến rất hữu ích cần có khi xây dựng mô hình bất động sản là vĩ độ và kinh độ của mỗi địa chỉ. Bạn có thể lấy dữ liệu này thông qua bộ mã hóa địa lý sử dụng địa chỉ đường phố để chỉ định vĩ độ và kinh độ. Bộ mã hóa địa lý của Cục điều tra dân số Hoa Kỳ cũng sẽ xác định đường điều tra dân số cho từng địa điểm thường được sử dụng để tổng hợp thông tin nhân khẩu học và tâm lý học.

Phân tích, chuyển đổi và tạo các biến mới.

Bây giờ chúng tôi đã chọn các nguồn dữ liệu của mình, chúng tôi cần kiểm tra chất lượng của dữ liệu. Cách dễ nhất để kiểm tra chất lượng dữ liệu là chạy bảng tần suất cho một vài biến chính. Nếu có một số lượng đáng kể các mục nhập bị thiếu hoặc bị hỏng, chúng tôi sẽ cần kiểm tra dữ liệu thêm. Bảng bên dưới cho thấy chỉ 1 trong số 216.498 bản ghi có mã zip bị thiếu trong tệp bán hàng và không có mã zip nào bị sai như 99999 hoặc 1X # 45. Điều này có thể chỉ ra rằng đây là một tập dữ liệu chất lượng cao.

Từ điển dữ liệu là một nguồn tài nguyên tuyệt vời khi có sẵn. Nó sẽ cung cấp mô tả về những gì mỗi biến đang đo lường và các tùy chọn có thể có cho biến. Dữ liệu của chúng tôi chứa phân tích về từng giao dịch bán được thực hiện trong quận. Đây là thông tin quan trọng, đặc biệt là khi làm việc với hồ sơ chứng thư thô. Tất cả các giao dịch bất động sản phải được ghi nhận để có hiệu lực thi hành theo luật định, nhưng không phải tất cả các giao dịch chuyển nhượng đều phản ánh đúng giá trị thị trường hợp lý của bất động sản. Ví dụ, một giao dịch mua bán giữa hai thành viên trong gia đình có thể ở mức giá thấp hơn giá thị trường như một hình thức quà tặng hoặc để tránh phải trả chi phí giao dịch cao hơn như tem chứng thư. May mắn cho chúng tôi, chính quyền địa phương đánh dấu rõ ràng các vụ chuyển nhượng mà họ cho là không đại diện cho giá trị thị trường hiện tại, vì vậy chúng tôi sẽ chỉ sử dụng hồ sơ phản ánh “giao dịch hợp lệ”. Những lần bán hàng này chỉ chiếm khoảng 18% tổng số giao dịch, minh họa tầm quan trọng của việc hiểu dữ liệu của bạn trước khi bạn bắt đầu sử dụng nó để phân tích. Theo kinh nghiệm của tôi, tỷ lệ này khá phổ biến khi phân tích hồ sơ chứng thư. Rất có thể nếu chúng tôi xây dựng một mô hình bao gồm "bán hàng không hợp lệ" thì kết quả cuối cùng của chúng tôi sẽ bị bóp méo.

Tiếp theo, chúng tôi sẽ thêm dữ liệu thẩm định và điểm số vào hồ sơ bán hàng. Điều này cung cấp cho chúng tôi một bảng duy nhất để sử dụng cho mô hình của chúng tôi. Lúc này, chúng ta cần phân tích các biến để xem chúng có phù hợp với hồi quy tuyến tính hay không. Dưới đây là bảng hiển thị các loại biến khác nhau.

Tệp của chúng tôi chứa một số giá trị danh nghĩa như vùng lân cận hoặc mã zip, phân loại dữ liệu không theo thứ tự. Các giá trị danh nghĩa không thích hợp cho hồi quy tuyến tính mà không có phép biến đổi. Ngoài ra còn có một số biến thứ tự đánh giá chất lượng xây dựng, tình trạng hiện tại của tài sản, v.v. Việc sử dụng dữ liệu thứ tự chỉ thích hợp khi chúng ta có thể giả định một cách hợp lý rằng mỗi thứ hạng đều cách đều nhau. Ví dụ:dữ liệu của chúng tôi có một biến điểm với 19 phân loại khác nhau (A +, A, A-, v.v.), vì vậy chúng tôi có thể giả định một cách an toàn rằng các cấp này có khả năng cách đều nhau.

Cũng có một số biến cần được chuyển đổi trước khi chúng ta có thể sử dụng chúng trong mô hình. Một giá trị danh nghĩa có thể được chuyển đổi thành một biến giả để thử nghiệm là biến sưởi ấm và làm mát. Chúng tôi sẽ đặt biến thành 0 cho tất cả các thuộc tính không có điều hòa nhiệt độ và những thuộc tính có điều hòa nhiệt độ thành 1. Ngoài ra, các loại chữ cái cần được chuyển đổi thành số (ví dụ:0 =Tồi tệ nhất, 1 =Tốt hơn, 2 =Tốt nhất) để xem nếu có mối quan hệ tuyến tính với giá cả.

Cuối cùng, chúng ta cần xác định xem có phù hợp để sử dụng tất cả các quan sát hay không. Chúng tôi muốn dự đoán giá trị của những ngôi nhà biệt lập dành cho một gia đình, vì vậy chúng tôi có thể loại bỏ tất cả các bất động sản thương mại, căn hộ và nhà phố khỏi dữ liệu. Chúng tôi cũng muốn tránh các vấn đề tiềm ẩn với tự tương quan, vì vậy chúng tôi chỉ sử dụng dữ liệu cho doanh số bán hàng trong năm 2017 để hạn chế khả năng điều này xảy ra. Sau khi loại bỏ tất cả các bản ghi không liên quan, chúng tôi có bộ dữ liệu cuối cùng của mình để được kiểm tra.

Lựa chọn mẫu và biến

Việc chọn kích thước mẫu chính xác có thể khó khăn. Trong số các tài liệu học thuật, có một loạt các con số tối thiểu được đề xuất và các quy tắc ngón tay cái khác nhau. Đối với nghiên cứu của chúng tôi, dân số tổng thể là khá lớn, vì vậy chúng tôi không cần phải lo lắng về việc có đủ cho một mẫu. Thay vào đó, chúng tôi gặp rủi ro khi có một mẫu quá lớn đến mức hầu hết mọi biến sẽ có ý nghĩa thống kê trong mô hình. Cuối cùng, khoảng 10% hồ sơ được chọn ngẫu nhiên để làm mô hình.

Lựa chọn biến có thể là một trong những phần khó nhất của quá trình nếu không có phần mềm thống kê. Tuy nhiên, SPSS cho phép chúng tôi nhanh chóng xây dựng nhiều mô hình từ sự kết hợp của các biến mà chúng tôi cho là thích hợp cho một hồi quy tuyến tính. SPSS sẽ tự động lọc ra các biến dựa trên ngưỡng của chúng tôi về ý nghĩa thống kê và chỉ trả lại những mô hình tốt nhất.

Xây dựng mô hình và xem xét kết quả

Từ dữ liệu mẫu của chúng tôi, SPSS đã tạo ra năm mô hình. Mô hình có tính dự đoán cao nhất bao gồm 5 biến sau.

  1. Xếp hạng dựa trên chất lượng xây dựng được xếp hạng 1-19 (1 =Rất kém và 19 =Xuất sắc)
  2. Khu vực sinh hoạt đã hoàn thiện
  3. Điều hòa nhiệt độ (Có / Không)
  4. Kích thước Lô đất
  5. Hạng cho tình trạng vật chất hoặc tình trạng sửa chữa được xếp hạng 1-8 (1 =Không thể ở được và 8 =xuất sắc)

Hãy xem kết quả từ SPSS. Trọng tâm chính của chúng tôi ban đầu sẽ là giá trị bình phương R cho chúng tôi biết phần trăm phương sai trong biến phụ thuộc (giá) được dự đoán bởi hồi quy. Giá trị tốt nhất có thể sẽ là 1 và kết quả của mô hình của chúng tôi là khá hứa hẹn. Sai số tiêu chuẩn của ước tính đo độ chính xác của mô hình có vẻ khá cao ở mức 73.091 đô la. Tuy nhiên, nếu chúng ta so sánh điều đó với độ lệch chuẩn của giá bán trong mô hình ($ 160.429), thì sai số có vẻ hợp lý.

Mô hình 5 có một lỗi tiêu chuẩn có thể chấp nhận được và vượt qua Bài kiểm tra Durbin-Watson

SPSS có chức năng tích hợp để kiểm tra tự tương quan bằng Kiểm tra Durbin-Watson. Tốt nhất, giá trị sẽ là 2,0 trên thang điểm từ 0 đến 4, nhưng giá trị 1,652 sẽ không gây ra cảnh báo.

Tiếp theo, chúng tôi kiểm tra kết quả của mô hình để xác định xem có bất kỳ bằng chứng nào về phương sai thay đổi hay không. Không có chức năng tích hợp nào cho SPSS, nhưng sử dụng macro này do Ahmad Daryanto viết, chúng ta có thể sử dụng các bài kiểm tra Breusch-Pagan và Koenker. Các kiểm định này cho thấy rằng có sự hiện diện của phương sai thay đổi trong mô hình của chúng tôi vì mức ý nghĩa (Sig) trong biểu đồ dưới đây là dưới 0,005. Mô hình của chúng tôi đã vi phạm một trong những giả định cổ điển của hồi quy tuyến tính. Rất có thể một trong các biến trong mô hình cần được chuyển đổi để loại bỏ vấn đề. Tuy nhiên, trước khi chúng ta thực hiện việc này, chúng ta nên xem tác động của phương sai thay đổi lên sức mạnh dự đoán của các biến độc lập của chúng ta là gì. Thông qua việc sử dụng macro do Andrew F. Hayes phát triển, chúng ta có thể xem xét các sai số chuẩn đã điều chỉnh và mức ý nghĩa cho các biến độc lập của chúng ta.

Có hiện diện phương sai thay đổi trong mô hình, nhưng các kiểm định sâu hơn cho thấy rằng nó không ảnh hưởng đến các biến độc lập

Thử nghiệm thêm cho thấy rằng các biến độc lập vẫn có ý nghĩa thống kê, sau khi tính toán phương sai thay đổi trong mô hình, vì vậy chúng tôi không nhất thiết phải thay đổi nó ngay bây giờ.

Kiểm tra và tinh chỉnh mô hình

Là bài kiểm tra cuối cùng, chúng tôi sẽ cho điểm tất cả các hồ sơ bán hàng không thuộc mẫu ban đầu với mô hình của chúng tôi. Điều này sẽ giúp chúng tôi xem mô hình hoạt động như thế nào trên một tập dữ liệu lớn hơn. Kết quả của thử nghiệm này cho thấy giá trị bình phương R và sai số chuẩn của ước tính không thay đổi đáng kể trên tập dữ liệu lớn, điều này có khả năng chỉ ra rằng mô hình của chúng tôi sẽ hoạt động như mong đợi.

Việc áp dụng mô hình vào tập dữ liệu đầy đủ cho thấy sự nhất quán với mẫu, với các giá trị sai số chuẩn và bình phương R tương tự được quan sát

Nếu chúng tôi muốn sử dụng mô hình ví dụ của mình trong cuộc sống thực, chúng tôi có thể sẽ phân đoạn dữ liệu hơn nữa để có một số mô hình chính xác hơn hoặc tìm kiếm dữ liệu bổ sung để nâng cao độ chính xác của mô hình đơn lẻ này. Các bước này cũng có thể loại bỏ phương sai thay đổi mà chúng ta thấy trong mô hình. Dựa trên thực tế là chúng tôi đang cố gắng sử dụng một mô hình duy nhất để dự đoán giá trị của những ngôi nhà ở một quận có hơn 1 triệu dân, không có gì ngạc nhiên khi chúng tôi không thể xây dựng mô hình “hoàn hảo” chỉ trong vài giờ .

Kết luận

Mục tiêu của chúng tôi là xây dựng một mô hình dự đoán giá trị của những ngôi nhà biệt lập dành cho một gia đình. Phân tích của chúng tôi cho thấy rằng chúng tôi đã hoàn thành mục tiêu đó với độ chính xác hợp lý, nhưng liệu mô hình của chúng tôi có hợp lý không?

Nếu chúng ta mô tả mô hình của chúng tôi, chúng tôi sẽ nói rằng giá trị của một ngôi nhà phụ thuộc vào diện tích của lô đất, diện tích đất vuông của ngôi nhà, chất lượng xây dựng, tình trạng sửa chữa hiện tại và nó có hay không. máy lạnh. Điều này có vẻ rất hợp lý. Trên thực tế, nếu chúng ta so sánh mô hình của chúng tôi với các phương pháp định giá truyền thống, chúng ta thấy rằng nó rất giống với cách tiếp cận chi phí, tức là cộng thêm chi phí mua đất và xây dựng một tòa nhà mới được điều chỉnh cho hiện trạng lỗi thời. Tuy nhiên, sự tương đồng này có thể là, khi sử dụng một cụm từ hồi quy, một mối tương quan giả.

Thông thường, phương pháp tiếp cận chi phí là chỉ được khuyến nghị để định giá các tài sản mới hơn, do các vấn đề với việc xác định phương pháp khấu hao thích hợp cho các tài sản cũ hơn. Với mô hình của mình, chúng tôi đã tạo ra một chiến lược tương tự hữu ích cho các thuộc tính ở mọi lứa tuổi, trên thực tế, chúng tôi đã kiểm tra độ tuổi như một biến độc lập và kết luận rằng nó không có tác động thống kê đáng kể đến giá trị thuộc tính!

Sử dụng Phân tích Hồi quy cho Doanh nghiệp của Bạn

Hy vọng rằng đến đây, bạn đã hiểu rõ hơn về những kiến ​​thức cơ bản của phân tích hồi quy. Câu hỏi tiếp theo là:nó có thể giúp gì cho doanh nghiệp của bạn không? Nếu bạn trả lời có cho bất kỳ câu hỏi nào trong số này, thì bạn có thể có lợi khi sử dụng phân tích hồi quy như một công cụ.

  1. Bạn có muốn một cách tiếp cận khoa học hơn để xác định giá trị, đưa ra dự đoán hay phân tích một thị trường cụ thể không?
  2. Bạn đang tìm kiếm những cách tốt hơn để xác định các khoản đầu tư bất động sản tiềm năng trên các khu vực, khu vực rộng lớn hoặc thậm chí trên toàn quốc?
  3. Mục tiêu của bạn có phải là thu hút các nhà bán lẻ lớn, nhà hàng hoặc công ty khách sạn cho dự án bất động sản thương mại của mình không?
  4. Bạn có nghĩ rằng bạn có thể cải thiện quy trình ra quyết định của mình bằng cách kết hợp các điểm dữ liệu mới vào quy trình không?
  5. Bạn có lo lắng về lợi tức đầu tư vào hoạt động tiếp thị cho người mua và nhà đầu tư không?

Mô hình ví dụ trên là một minh chứng đơn giản về giá trị của việc sử dụng mô hình hồi quy trong bất động sản. Mất 2-3 giờ để thu thập dữ liệu và xây dựng mô hình còn lâu mới thể hiện hết tiềm năng của nó. Trên thực tế, có rất nhiều cách sử dụng để phân tích hồi quy trong ngành bất động sản ngoài việc định giá tài sản, bao gồm:

  1. Phân tích định giá để biết giá niêm yết và giá thuê
  2. Phân tích nhân khẩu học và tâm lý của người mua và người thuê nhà ở.
  3. Xác định các mục tiêu cho tiếp thị trực tiếp
  4. Phân tích ROI cho các chiến dịch tiếp thị

Mô hình không gian địa lý sử dụng các nguyên tắc của phân tích hồi quy kết hợp với ba điều quan trọng nhất trong bất động sản:vị trí, vị trí, vị trí. Làm việc với tư cách là nhà phát triển khu dân cư trong tám năm, tôi có thể chứng minh sức mạnh của mô hình không gian địa lý. Bằng cách sử dụng ArcGIS, tôi có thể kết hợp dữ liệu bán hàng, bản đồ lô đất và dữ liệu lidar để tìm các tài sản lý tưởng để phát triển ở vùng núi Bắc Carolina.

Theo kinh nghiệm của tôi, hầu hết tiền trong bất động sản được tạo ra từ việc mua lại không phải là phát triển một dự án. Có thể xác định các cơ hội mà người khác bỏ lỡ có thể là một lợi thế cạnh tranh to lớn trong lĩnh vực bất động sản. Phân tích không gian địa lý là thứ mà các công ty lớn đã tận dụng trong nhiều năm, nhưng các công ty nhỏ hơn thường bỏ qua.

Cách xác định Đối tác Analytics phù hợp cho Doanh nghiệp của bạn

Rất ít người đánh giá thống kê là chủ đề yêu thích của họ. In fact, as a whole people are very bad at understanding even basic probabilities. If you’re doubtful of this opinion, take a trip to Las Vegas or Macau. Unfortunately, this can make it difficult to determine who to trust when you’re looking for advice on implementing regression analysis in your process. Here are some key things to look for when evaluating potential candidates

While people are bad at judging probabilities, intuition is actually rather good at detecting lies. You should be very skeptical of anyone who claims to be able to build a model that will answer all your questions! Don’t trust a guarantee of results. Hopefully, this article has illustrated the fact that regression analysis is based on empirical observation and sound science. It will always be the case that certain things are easier to predict than others. A trusted advisor will be open and honest when they can’t find the answers you’re looking for, and they won’t run through your budget trying to find one that isn’t there.

Look for Mr. Spock instead of Captain Kirk. Sound research can be an excellent marketing tool, but far too often people pay for sexy marketing materials with a whiff of pseudo-research and no logic to back it up. Some people are naturally more analytical, but great analytical skills come from practice. Ideally, anyone you hire to analyze data for your business will have experience finding solutions to a wide variety of problems. Someone with a narrow focus may be more susceptible to groupthink, especially when their experiences closely mirror your own.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won’t help if you can’t put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren’t the right fit for your company.


Tài chính doanh nghiệp
  1. Kế toán
  2. Chiến lược kinh doanh
  3. Việc kinh doanh
  4. Quản trị quan hệ khách hàng
  5. tài chính
  6. Quản lý chứng khoán
  7. Tài chính cá nhân
  8. đầu tư
  9. Tài chính doanh nghiệp
  10. ngân sách
  11. Tiết kiệm
  12. bảo hiểm
  13. món nợ
  14. về hưu