Tóm tắt điều hành
Quá thường xuyên trong lĩnh vực bất động sản, quá trình định giá có thể được xem như một bài tập mút ngón tay cái. Người môi giới bất động sản sẽ đến, đá vào lốp xe như câu tục ngữ, và sau đó tạo ra một giá trị ước tính với rất ít cái nhìn sâu sắc về “định lượng”. Có lẽ quá trình này trở nên trầm trọng hơn bởi tình cảm gắn bó mà việc sở hữu bất động sản mang lại vì đối với nhiều người, một ngôi nhà sẽ là khoản đầu tư tài chính lớn nhất trong đời.
Tuy nhiên, có một phương pháp cho sự điên rồ này. Chà, chính xác là ba.
Phương pháp bán hàng so sánh phổ biến nhất trong bất động sản nhà ở và sử dụng doanh số bán các bất động sản tương tự gần đây để xác định giá trị của một tài sản chủ thể. Giá bán của "máy tính" được điều chỉnh dựa trên sự khác biệt giữa chúng và thuộc tính chủ thể. Ví dụ:nếu một cơ sở kinh doanh tương đương có thêm một phòng tắm, thì giá trị ước tính của phòng tắm sẽ được trừ vào giá bán quan sát được của nó.
Bất động sản thương mại được coi là không đồng nhất hơn, vì vậy phương pháp bán hàng so sánh được sử dụng ít thường xuyên hơn. Phương pháp tiếp cận thu nhập, dựa trên khái niệm rằng giá trị nội tại của tài sản tương đương với tổng của tất cả các dòng tiền chiết khấu của nó, được áp dụng phổ biến hơn qua hai phương pháp:
Kỹ thuật cuối cùng là cách tiếp cận chi phí, ước tính giá trị dựa trên chi phí mua một mảnh đất giống hệt nhau và xây dựng một bản sao của tài sản chủ thể. Sau đó, chi phí của dự án được khấu hao dựa trên tình trạng lỗi thời hiện tại của tài sản chủ thể. Tương tự như các điều chỉnh trong cách tiếp cận bán hàng so sánh, mục tiêu là để phù hợp chặt chẽ với tài sản chủ thể. Phương pháp chi phí ít được sử dụng thường xuyên hơn so với hai phương pháp còn lại.
Tất cả các phương pháp định giá bất động sản truyền thống đều mang tính chủ quan, do việc lựa chọn các yếu tố đầu vào được sử dụng để định giá. Ví dụ:việc lựa chọn tỷ lệ giới hạn có tác động đáng kể đến việc định giá tài sản:khi định giá tài sản với NOI là 1 triệu đô la, tỷ lệ giới hạn tăng 4% (từ 6% lên 10%) sẽ làm giảm giá trị của tài sản tăng 40% (Biểu đồ bên dưới).
Có rất nhiều lợi ích khi sử dụng mô hình hồi quy để định giá bất động sản. Ngành công nghiệp bán lẻ đã chấp nhận việc sử dụng nó để lựa chọn địa điểm, nhưng ngành bất động sản, phần lớn, đã bỏ qua những lợi thế tiềm năng của nó. Phân tích hồi quy đặc biệt thích hợp để phân tích một lượng lớn dữ liệu. Thực tế là không thể có kiến thức vững chắc về mọi thị trường bất động sản địa phương trong nước, nhưng mô hình hồi quy có thể giúp thu hẹp tìm kiếm.
Lợi ích lớn nhất của việc sử dụng mô hình hồi quy là tính linh hoạt vốn có của nó - chúng có thể hoạt động độc lập với các mô hình khác hoặc kết hợp với chúng.
Cách tiếp cận trực tiếp nhất là sử dụng dữ liệu bán hàng hiện có để dự đoán giá trị của thuộc tính chủ thể, làm đầu ra cho mô hình. Có rất nhiều nguồn dữ liệu miễn phí từ các cơ quan địa phương, tiểu bang và liên bang có thể được bổ sung bằng các nhà cung cấp dữ liệu tư nhân.
Một lựa chọn khác là sử dụng các mô hình hồi quy để dự đoán chính xác hơn các yếu tố đầu vào cho các phương pháp định giá truyền thống khác. Ví dụ:khi phân tích một dự án thương mại hỗn hợp, nhà phát triển có thể xây dựng một mô hình để dự đoán doanh thu trên mỗi foot vuông cho không gian bán lẻ và một mô hình khác để dự đoán giá thuê cho thành phần dân cư. Sau đó, cả hai điều này có thể được sử dụng làm đầu vào cho phương pháp tiếp cận thu nhập để định giá.
Sử dụng các nguyên tắc thống kê hợp lý mang lại một cách tiếp cận khách quan hơn để định giá. Đó là một trong những cách tốt nhất để tránh thiên vị xác nhận, xảy ra khi mọi người tìm kiếm thông tin xác nhận quan điểm hiện có của họ hoặc từ chối thông tin mới mâu thuẫn với nó. Khi tôi đã xây dựng các mô hình cho các nhà bán lẻ để dự đoán doanh số cửa hàng mới, họ thường ngạc nhiên khi biết rằng nhiều nhà bán lẻ được lợi khi ở gần đối thủ cạnh tranh. Trên thực tế, vị trí với Walmart, người thường là đối thủ cạnh tranh lớn nhất của họ, là một trong những biến số phổ biến nhất được sử dụng trong các mô hình của tôi. Dựa vào những thành kiến hiện có có thể dẫn đến việc bỏ lỡ những cơ hội, hoặc thậm chí tệ hơn là che giấu những thảm họa ngay bên cạnh.
Một số lợi thế khách quan của định giá thống kê là:
Mô hình hồi quy là duy nhất trong thực tế là chúng được tích hợp sẵn tính năng kiểm tra độ chính xác. Sau khi xây dựng mô hình trên một mẫu của tổng dân số, bạn có thể sử dụng mô hình trên dữ liệu ngoài mẫu để phát hiện sai lệch lấy mẫu có thể có.
Các phương pháp định giá truyền thống đều có rủi ro sai lệch lựa chọn đáng kể. Khi chọn các thuộc tính có thể so sánh được, bạn rất dễ rơi vào bẫy chọn các kết quả tốt nhất và cho rằng chúng giống với dự án của bạn nhất. Ngoài ra còn có sự nhấn mạnh vào việc dự đoán các biến số, chẳng hạn như tỷ lệ lợi nhuận trong cách tiếp cận thu nhập. Việc loại bỏ nhu cầu dự đoán này có thể hấp dẫn nhiều nhà đầu tư bất động sản, đó là lý do tại sao định giá dựa trên hồi quy là một cách tiếp cận hữu ích.
Số lượng câu chuyện cười trích dẫn tỷ lệ phần trăm khác nhau của thống kê được tạo thành thực sự là một trò đùa. Hầu như ngày nào chúng ta cũng bị các phương tiện truyền thông đưa tin rầm rộ về kết quả của một nghiên cứu mới, nhiều trong số đó dường như mâu thuẫn với một nghiên cứu được công bố vào năm ngoái. Trong một thế giới của những kẻ khó hiểu, không có thời gian để thảo luận về mức độ nghiêm ngặt của các phương pháp mà các nhà nghiên cứu sử dụng.
Có nhiều loại phân tích hồi quy, nhưng phổ biến nhất là hồi quy tuyến tính. Có một số giả định nhất định về hồi quy tuyến tính không được vi phạm để coi mô hình là hợp lệ. Việc vi phạm các giả định này sẽ làm sai lệch các thử nghiệm thống kê tính toán sức mạnh dự đoán của các yếu tố đầu vào và mô hình tổng thể.
Cần có mối quan hệ tuyến tính giữa các yếu tố đầu vào (biến độc lập) và đầu ra (biến phụ thuộc). Ví dụ, chúng ta có thể giả định rằng có một mối quan hệ tuyến tính giữa bộ vuông nóng trong một ngôi nhà và giá trị tổng thể của nó. Tuy nhiên, do lợi nhuận giảm dần, chúng tôi có thể phát hiện ra rằng mối quan hệ này là phi tuyến tính, đòi hỏi phải chuyển đổi dữ liệu thô.
Các biến độc lập không được ngẫu nhiên. Nói một cách đơn giản, các quan sát cho mỗi biến độc lập trong mô hình là cố định và được giả định là không có sai số trong phép đo của chúng. Ví dụ:nếu chúng tôi đang sử dụng số lượng đơn vị để lập mô hình giá trị của một tòa nhà chung cư, thì tất cả các tòa nhà trong dữ liệu mẫu của chúng tôi sẽ có một số đơn vị cố định không thay đổi, bất kể chúng tôi xây dựng mô hình như thế nào.
"Phần còn lại" của mô hình (tức là sự khác biệt giữa kết quả dự đoán của mô hình và các quan sát thực tế) sẽ tổng bằng 0 hoặc nói một cách đơn giản hơn:mô hình chúng tôi sẽ sử dụng sẽ đại diện cho dòng phù hợp nhất.
Mô hình phải chính xác cho tất cả các quan sát cho mỗi biến độc lập. Nếu chúng tôi dự đoán giá trị của một ngôi nhà dựa trên diện tích vuông của nó, chúng tôi sẽ không muốn sử dụng mô hình nếu nó cực kỳ chính xác trong việc dự đoán giá trị cho những ngôi nhà dưới 1.500 mét vuông, nhưng có một lượng lớn sai số đối với những ngôi nhà trên 3.000 thước vuông. Điều này được gọi là phương sai thay đổi.
Một trong những vấn đề phổ biến nhất đối với hồi quy tuyến tính khi nhìn vào ngành bất động sản là mối tương quan của sai số dư giữa các lần quan sát. Bạn có thể coi đây là nhiễu trắng không có khuôn mẫu. Tuy nhiên, nếu có một mô hình đối với phần còn lại, thì rất có thể chúng ta cần phải thực hiện điều chỉnh. Vấn đề này rất khó để khái niệm hóa, nhưng có hai lĩnh vực chính mà đây là mối quan tâm trong ngành bất động sản.
Việc xây dựng một mô hình dựa trên các quan sát trong một khoảng thời gian dài sẽ không thích hợp để dự đoán các giá trị hiện tại. Giả sử chúng ta đã xây dựng một mô hình để dự đoán giá trị của bất động sản khách sạn bằng cách sử dụng giá phòng trung bình như một biến độc lập. Khả năng dự đoán của biến này có thể bị sai lệch vì giá phòng đã tăng liên tục theo thời gian. Về mặt thống kê, có sự tự tương quan giữa giá phòng trung bình quan sát được cho thấy xu hướng tích cực theo thời gian (tức là lạm phát) sẽ không được tính đến trong mô hình. Phương pháp bán hàng so sánh truyền thống được sử dụng rộng rãi nhất trong bất động sản nhà ở giúp loại bỏ vấn đề này bằng cách chỉ sử dụng dữ liệu gần đây nhất. Vì số lượng giao dịch thương mại ít hơn rất nhiều, giới hạn thời gian này thường làm cho phương pháp bán hàng có thể so sánh không hiệu quả. Tuy nhiên, có những kỹ thuật sử dụng hồi quy tuyến tính có thể khắc phục được các vấn đề của tự tương quan.
Hiệu ứng cụm cũng là một thách thức đáng kể trong việc lập mô hình định giá bất động sản. Điều này có thể được coi là tự tương quan không gian. Cách đơn giản nhất để giải quyết vấn đề này là hình dung việc xây dựng một mô hình dự đoán giá trị của những ngôi nhà ở hai khu phố (A và B) ở hai bên đường cao tốc. Nhìn chung, mô hình có thể hoạt động tốt trong việc dự đoán các giá trị, nhưng khi chúng tôi kiểm tra các lỗi còn lại, chúng tôi nhận thấy có một mô hình. Những ngôi nhà ở khu phố A thường được định giá cao hơn khoảng 10%, và những ngôi nhà ở khu phố B được định giá thấp hơn khoảng 10%. Để cải thiện mô hình của mình, chúng tôi cần tính đến hiệu ứng cụm này hoặc xây dựng một mô hình cho mỗi vùng lân cận.
Lý tưởng nhất là các biến trong mô hình sẽ không tương quan với nhau. Vấn đề này được gọi là đa cộng tuyến. Sử dụng cả bộ vuông và số lượng điểm đỗ xe làm đầu vào cho một mô hình đánh giá các trung tâm thương mại trong khu vực có thể sẽ chứng tỏ sự đa cộng tuyến. Điều này là trực quan vì các mã quy hoạch thường yêu cầu một số điểm đỗ xe nhất định dựa trên diện tích mặt bằng của một không gian thương mại. Trong ví dụ này, việc loại bỏ một trong các biến sẽ đưa ra đánh giá chính xác hơn về mô hình đã điều chỉnh mà không làm giảm đáng kể khả năng dự đoán của nó.
Sử dụng dữ liệu quan sát là cốt lõi của bất kỳ phương pháp tiếp cận thực nghiệm nào, nhưng điều quan trọng cần nhớ là các kết quả trong quá khứ không phải lúc nào cũng dự đoán được tương lai. Các tài sản kém thanh khoản như bất động sản đặc biệt dễ bị ảnh hưởng bởi những thay đổi trong chu kỳ kinh doanh. Khả năng dự đoán đối với một số biến số nhất định có thể thay đổi dựa trên các điều kiện kinh tế hiện tại. Vấn đề này không phải là duy nhất đối với hồi quy tuyến tính và cũng được tìm thấy với các cách tiếp cận truyền thống.
Tương quan không phải là nhân quả bình đẳng. Mục đích của việc xây dựng mô hình là tìm ra các biến hữu ích sẽ đưa ra các dự đoán hợp lệ. Bạn phải cảnh giác với các mối tương quan giả mạo. Bạn có thể ngạc nhiên khi biết rằng có một mối tương quan cực kỳ chặt chẽ giữa tỷ lệ ly hôn ở Maine và mức tiêu thụ bơ thực vật trên đầu người. Tuy nhiên, sử dụng dữ liệu ly hôn từ Maine sẽ không hợp lý nếu bạn đang cố gắng dự đoán doanh số bán bơ thực vật trong tương lai.
Bây giờ chúng ta hãy áp dụng kiến thức này một cách thực tế và xây dựng một mô hình tuyến tính từ đầu đến cuối. Đối với ví dụ của chúng tôi, chúng tôi sẽ cố gắng xây dựng một mô hình định giá bất động sản dự đoán giá trị của những ngôi nhà biệt lập dành cho một gia đình ở Quận Alleghany, Pennsylvania. Việc lựa chọn Quận Alleghany là tùy ý, và các hiệu trưởng được chứng minh sẽ phù hợp với bất kỳ địa điểm nào. Chúng tôi sẽ sử dụng Excel và SPSS, đây là một phần mềm thống kê được sử dụng phổ biến.
Tìm kiếm dữ liệu chất lượng là bước đầu tiên trong việc xây dựng một mô hình chính xác và có lẽ là quan trọng nhất. Mặc dù tất cả chúng ta đều đã nghe đến cụm từ “rác vào, bỏ rác ra ngoài”, nhưng điều quan trọng cần nhớ là không có tập dữ liệu hoàn hảo. Điều này là tốt miễn là chúng ta có thể thoải mái cho rằng dữ liệu mẫu là đại diện cho toàn bộ dân số. Có ba nguồn dữ liệu bất động sản chính:
Chúng tôi sẽ độc quyền sử dụng dữ liệu miễn phí cho ví dụ của mình, lấy từ Trung tâm Dữ liệu Khu vực Tây Pennsylvania và Cục Điều tra Dân số Hoa Kỳ. Dữ liệu Bán hàng Bất động sản của Alleghany sẽ cung cấp cho chúng tôi một tệp cơ sở để quan sát chúng tôi với giá bán là biến phụ thuộc của chúng tôi (biến Y). Chúng tôi cũng sẽ kiểm tra các biến bằng cách sử dụng điểm đi bộ cho mỗi đường điều tra dân số và thông tin thẩm định thuế.
Một biến rất hữu ích cần có khi xây dựng mô hình bất động sản là vĩ độ và kinh độ của mỗi địa chỉ. Bạn có thể lấy dữ liệu này thông qua bộ mã hóa địa lý sử dụng địa chỉ đường phố để chỉ định vĩ độ và kinh độ. Bộ mã hóa địa lý của Cục điều tra dân số Hoa Kỳ cũng sẽ xác định đường điều tra dân số cho từng địa điểm thường được sử dụng để tổng hợp thông tin nhân khẩu học và tâm lý học.
Bây giờ chúng tôi đã chọn các nguồn dữ liệu của mình, chúng tôi cần kiểm tra chất lượng của dữ liệu. Cách dễ nhất để kiểm tra chất lượng dữ liệu là chạy bảng tần suất cho một vài biến chính. Nếu có một số lượng đáng kể các mục nhập bị thiếu hoặc bị hỏng, chúng tôi sẽ cần kiểm tra dữ liệu thêm. Bảng bên dưới cho thấy chỉ 1 trong số 216.498 bản ghi có mã zip bị thiếu trong tệp bán hàng và không có mã zip nào bị sai như 99999 hoặc 1X # 45. Điều này có thể chỉ ra rằng đây là một tập dữ liệu chất lượng cao.
Từ điển dữ liệu là một nguồn tài nguyên tuyệt vời khi có sẵn. Nó sẽ cung cấp mô tả về những gì mỗi biến đang đo lường và các tùy chọn có thể có cho biến. Dữ liệu của chúng tôi chứa phân tích về từng giao dịch bán được thực hiện trong quận. Đây là thông tin quan trọng, đặc biệt là khi làm việc với hồ sơ chứng thư thô. Tất cả các giao dịch bất động sản phải được ghi nhận để có hiệu lực thi hành theo luật định, nhưng không phải tất cả các giao dịch chuyển nhượng đều phản ánh đúng giá trị thị trường hợp lý của bất động sản. Ví dụ, một giao dịch mua bán giữa hai thành viên trong gia đình có thể ở mức giá thấp hơn giá thị trường như một hình thức quà tặng hoặc để tránh phải trả chi phí giao dịch cao hơn như tem chứng thư. May mắn cho chúng tôi, chính quyền địa phương đánh dấu rõ ràng các vụ chuyển nhượng mà họ cho là không đại diện cho giá trị thị trường hiện tại, vì vậy chúng tôi sẽ chỉ sử dụng hồ sơ phản ánh “giao dịch hợp lệ”. Những lần bán hàng này chỉ chiếm khoảng 18% tổng số giao dịch, minh họa tầm quan trọng của việc hiểu dữ liệu của bạn trước khi bạn bắt đầu sử dụng nó để phân tích. Theo kinh nghiệm của tôi, tỷ lệ này khá phổ biến khi phân tích hồ sơ chứng thư. Rất có thể nếu chúng tôi xây dựng một mô hình bao gồm "bán hàng không hợp lệ" thì kết quả cuối cùng của chúng tôi sẽ bị bóp méo.
Tiếp theo, chúng tôi sẽ thêm dữ liệu thẩm định và điểm số vào hồ sơ bán hàng. Điều này cung cấp cho chúng tôi một bảng duy nhất để sử dụng cho mô hình của chúng tôi. Lúc này, chúng ta cần phân tích các biến để xem chúng có phù hợp với hồi quy tuyến tính hay không. Dưới đây là bảng hiển thị các loại biến khác nhau.
Tệp của chúng tôi chứa một số giá trị danh nghĩa như vùng lân cận hoặc mã zip, phân loại dữ liệu không theo thứ tự. Các giá trị danh nghĩa không thích hợp cho hồi quy tuyến tính mà không có phép biến đổi. Ngoài ra còn có một số biến thứ tự đánh giá chất lượng xây dựng, tình trạng hiện tại của tài sản, v.v. Việc sử dụng dữ liệu thứ tự chỉ thích hợp khi chúng ta có thể giả định một cách hợp lý rằng mỗi thứ hạng đều cách đều nhau. Ví dụ:dữ liệu của chúng tôi có một biến điểm với 19 phân loại khác nhau (A +, A, A-, v.v.), vì vậy chúng tôi có thể giả định một cách an toàn rằng các cấp này có khả năng cách đều nhau.
Cũng có một số biến cần được chuyển đổi trước khi chúng ta có thể sử dụng chúng trong mô hình. Một giá trị danh nghĩa có thể được chuyển đổi thành một biến giả để thử nghiệm là biến sưởi ấm và làm mát. Chúng tôi sẽ đặt biến thành 0 cho tất cả các thuộc tính không có điều hòa nhiệt độ và những thuộc tính có điều hòa nhiệt độ thành 1. Ngoài ra, các loại chữ cái cần được chuyển đổi thành số (ví dụ:0 =Tồi tệ nhất, 1 =Tốt hơn, 2 =Tốt nhất) để xem nếu có mối quan hệ tuyến tính với giá cả.
Cuối cùng, chúng ta cần xác định xem có phù hợp để sử dụng tất cả các quan sát hay không. Chúng tôi muốn dự đoán giá trị của những ngôi nhà biệt lập dành cho một gia đình, vì vậy chúng tôi có thể loại bỏ tất cả các bất động sản thương mại, căn hộ và nhà phố khỏi dữ liệu. Chúng tôi cũng muốn tránh các vấn đề tiềm ẩn với tự tương quan, vì vậy chúng tôi chỉ sử dụng dữ liệu cho doanh số bán hàng trong năm 2017 để hạn chế khả năng điều này xảy ra. Sau khi loại bỏ tất cả các bản ghi không liên quan, chúng tôi có bộ dữ liệu cuối cùng của mình để được kiểm tra.
Việc chọn kích thước mẫu chính xác có thể khó khăn. Trong số các tài liệu học thuật, có một loạt các con số tối thiểu được đề xuất và các quy tắc ngón tay cái khác nhau. Đối với nghiên cứu của chúng tôi, dân số tổng thể là khá lớn, vì vậy chúng tôi không cần phải lo lắng về việc có đủ cho một mẫu. Thay vào đó, chúng tôi gặp rủi ro khi có một mẫu quá lớn đến mức hầu hết mọi biến sẽ có ý nghĩa thống kê trong mô hình. Cuối cùng, khoảng 10% hồ sơ được chọn ngẫu nhiên để làm mô hình.
Lựa chọn biến có thể là một trong những phần khó nhất của quá trình nếu không có phần mềm thống kê. Tuy nhiên, SPSS cho phép chúng tôi nhanh chóng xây dựng nhiều mô hình từ sự kết hợp của các biến mà chúng tôi cho là thích hợp cho một hồi quy tuyến tính. SPSS sẽ tự động lọc ra các biến dựa trên ngưỡng của chúng tôi về ý nghĩa thống kê và chỉ trả lại những mô hình tốt nhất.
Từ dữ liệu mẫu của chúng tôi, SPSS đã tạo ra năm mô hình. Mô hình có tính dự đoán cao nhất bao gồm 5 biến sau.
Hãy xem kết quả từ SPSS. Trọng tâm chính của chúng tôi ban đầu sẽ là giá trị bình phương R cho chúng tôi biết phần trăm phương sai trong biến phụ thuộc (giá) được dự đoán bởi hồi quy. Giá trị tốt nhất có thể sẽ là 1 và kết quả của mô hình của chúng tôi là khá hứa hẹn. Sai số tiêu chuẩn của ước tính đo độ chính xác của mô hình có vẻ khá cao ở mức 73.091 đô la. Tuy nhiên, nếu chúng ta so sánh điều đó với độ lệch chuẩn của giá bán trong mô hình ($ 160.429), thì sai số có vẻ hợp lý.
Mô hình 5 có một lỗi tiêu chuẩn có thể chấp nhận được và vượt qua Bài kiểm tra Durbin-Watson
SPSS có chức năng tích hợp để kiểm tra tự tương quan bằng Kiểm tra Durbin-Watson. Tốt nhất, giá trị sẽ là 2,0 trên thang điểm từ 0 đến 4, nhưng giá trị 1,652 sẽ không gây ra cảnh báo.
Tiếp theo, chúng tôi kiểm tra kết quả của mô hình để xác định xem có bất kỳ bằng chứng nào về phương sai thay đổi hay không. Không có chức năng tích hợp nào cho SPSS, nhưng sử dụng macro này do Ahmad Daryanto viết, chúng ta có thể sử dụng các bài kiểm tra Breusch-Pagan và Koenker. Các kiểm định này cho thấy rằng có sự hiện diện của phương sai thay đổi trong mô hình của chúng tôi vì mức ý nghĩa (Sig) trong biểu đồ dưới đây là dưới 0,005. Mô hình của chúng tôi đã vi phạm một trong những giả định cổ điển của hồi quy tuyến tính. Rất có thể một trong các biến trong mô hình cần được chuyển đổi để loại bỏ vấn đề. Tuy nhiên, trước khi chúng ta thực hiện việc này, chúng ta nên xem tác động của phương sai thay đổi lên sức mạnh dự đoán của các biến độc lập của chúng ta là gì. Thông qua việc sử dụng macro do Andrew F. Hayes phát triển, chúng ta có thể xem xét các sai số chuẩn đã điều chỉnh và mức ý nghĩa cho các biến độc lập của chúng ta.
Có hiện diện phương sai thay đổi trong mô hình, nhưng các kiểm định sâu hơn cho thấy rằng nó không ảnh hưởng đến các biến độc lập
Thử nghiệm thêm cho thấy rằng các biến độc lập vẫn có ý nghĩa thống kê, sau khi tính toán phương sai thay đổi trong mô hình, vì vậy chúng tôi không nhất thiết phải thay đổi nó ngay bây giờ.
Là bài kiểm tra cuối cùng, chúng tôi sẽ cho điểm tất cả các hồ sơ bán hàng không thuộc mẫu ban đầu với mô hình của chúng tôi. Điều này sẽ giúp chúng tôi xem mô hình hoạt động như thế nào trên một tập dữ liệu lớn hơn. Kết quả của thử nghiệm này cho thấy giá trị bình phương R và sai số chuẩn của ước tính không thay đổi đáng kể trên tập dữ liệu lớn, điều này có khả năng chỉ ra rằng mô hình của chúng tôi sẽ hoạt động như mong đợi.
Việc áp dụng mô hình vào tập dữ liệu đầy đủ cho thấy sự nhất quán với mẫu, với các giá trị sai số chuẩn và bình phương R tương tự được quan sát
Nếu chúng tôi muốn sử dụng mô hình ví dụ của mình trong cuộc sống thực, chúng tôi có thể sẽ phân đoạn dữ liệu hơn nữa để có một số mô hình chính xác hơn hoặc tìm kiếm dữ liệu bổ sung để nâng cao độ chính xác của mô hình đơn lẻ này. Các bước này cũng có thể loại bỏ phương sai thay đổi mà chúng ta thấy trong mô hình. Dựa trên thực tế là chúng tôi đang cố gắng sử dụng một mô hình duy nhất để dự đoán giá trị của những ngôi nhà ở một quận có hơn 1 triệu dân, không có gì ngạc nhiên khi chúng tôi không thể xây dựng mô hình “hoàn hảo” chỉ trong vài giờ .
Mục tiêu của chúng tôi là xây dựng một mô hình dự đoán giá trị của những ngôi nhà biệt lập dành cho một gia đình. Phân tích của chúng tôi cho thấy rằng chúng tôi đã hoàn thành mục tiêu đó với độ chính xác hợp lý, nhưng liệu mô hình của chúng tôi có hợp lý không?
Nếu chúng ta mô tả mô hình của chúng tôi, chúng tôi sẽ nói rằng giá trị của một ngôi nhà phụ thuộc vào diện tích của lô đất, diện tích đất vuông của ngôi nhà, chất lượng xây dựng, tình trạng sửa chữa hiện tại và nó có hay không. máy lạnh. Điều này có vẻ rất hợp lý. Trên thực tế, nếu chúng ta so sánh mô hình của chúng tôi với các phương pháp định giá truyền thống, chúng ta thấy rằng nó rất giống với cách tiếp cận chi phí, tức là cộng thêm chi phí mua đất và xây dựng một tòa nhà mới được điều chỉnh cho hiện trạng lỗi thời. Tuy nhiên, sự tương đồng này có thể là, khi sử dụng một cụm từ hồi quy, một mối tương quan giả.
Thông thường, phương pháp tiếp cận chi phí là chỉ được khuyến nghị để định giá các tài sản mới hơn, do các vấn đề với việc xác định phương pháp khấu hao thích hợp cho các tài sản cũ hơn. Với mô hình của mình, chúng tôi đã tạo ra một chiến lược tương tự hữu ích cho các thuộc tính ở mọi lứa tuổi, trên thực tế, chúng tôi đã kiểm tra độ tuổi như một biến độc lập và kết luận rằng nó không có tác động thống kê đáng kể đến giá trị thuộc tính!
Hy vọng rằng đến đây, bạn đã hiểu rõ hơn về những kiến thức cơ bản của phân tích hồi quy. Câu hỏi tiếp theo là:nó có thể giúp gì cho doanh nghiệp của bạn không? Nếu bạn trả lời có cho bất kỳ câu hỏi nào trong số này, thì bạn có thể có lợi khi sử dụng phân tích hồi quy như một công cụ.
Mô hình ví dụ trên là một minh chứng đơn giản về giá trị của việc sử dụng mô hình hồi quy trong bất động sản. Mất 2-3 giờ để thu thập dữ liệu và xây dựng mô hình còn lâu mới thể hiện hết tiềm năng của nó. Trên thực tế, có rất nhiều cách sử dụng để phân tích hồi quy trong ngành bất động sản ngoài việc định giá tài sản, bao gồm:
Mô hình không gian địa lý sử dụng các nguyên tắc của phân tích hồi quy kết hợp với ba điều quan trọng nhất trong bất động sản:vị trí, vị trí, vị trí. Làm việc với tư cách là nhà phát triển khu dân cư trong tám năm, tôi có thể chứng minh sức mạnh của mô hình không gian địa lý. Bằng cách sử dụng ArcGIS, tôi có thể kết hợp dữ liệu bán hàng, bản đồ lô đất và dữ liệu lidar để tìm các tài sản lý tưởng để phát triển ở vùng núi Bắc Carolina.
Theo kinh nghiệm của tôi, hầu hết tiền trong bất động sản được tạo ra từ việc mua lại không phải là phát triển một dự án. Có thể xác định các cơ hội mà người khác bỏ lỡ có thể là một lợi thế cạnh tranh to lớn trong lĩnh vực bất động sản. Phân tích không gian địa lý là thứ mà các công ty lớn đã tận dụng trong nhiều năm, nhưng các công ty nhỏ hơn thường bỏ qua.
Rất ít người đánh giá thống kê là chủ đề yêu thích của họ. In fact, as a whole people are very bad at understanding even basic probabilities. If you’re doubtful of this opinion, take a trip to Las Vegas or Macau. Unfortunately, this can make it difficult to determine who to trust when you’re looking for advice on implementing regression analysis in your process. Here are some key things to look for when evaluating potential candidates
While people are bad at judging probabilities, intuition is actually rather good at detecting lies. You should be very skeptical of anyone who claims to be able to build a model that will answer all your questions! Don’t trust a guarantee of results. Hopefully, this article has illustrated the fact that regression analysis is based on empirical observation and sound science. It will always be the case that certain things are easier to predict than others. A trusted advisor will be open and honest when they can’t find the answers you’re looking for, and they won’t run through your budget trying to find one that isn’t there.
Look for Mr. Spock instead of Captain Kirk. Sound research can be an excellent marketing tool, but far too often people pay for sexy marketing materials with a whiff of pseudo-research and no logic to back it up. Some people are naturally more analytical, but great analytical skills come from practice. Ideally, anyone you hire to analyze data for your business will have experience finding solutions to a wide variety of problems. Someone with a narrow focus may be more susceptible to groupthink, especially when their experiences closely mirror your own.
Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”
Finally, you should look for someone with whom you can communicate. All of the information in the world won’t help if you can’t put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren’t the right fit for your company.