जियोलोकेशन क्लस्टरिंग के लिए सही दृष्टिकोण और क्लस्टरिंग एल्गोरिदम क्या है?
मैं क्लस्टर जियोलोकेशन निर्देशांक के लिए निम्न कोड का उपयोग कर रहा हूं:
import numpy as np
import matplotlib.pyplot as plt
from scipy.cluster.vq import kmeans2, whiten
coordinates= np.array([
[lat, long],
[lat, long],
...
[lat, long]
])
x, y = kmeans2(whiten(coordinates), 3, iter = 20)
plt.scatter(coordinates[:,0], coordinates[:,1], c=y);
plt.show()
क्या जियोलोकेशन क्लस्टरिंग के लिए K- साधनों का उपयोग करना सही है, क्योंकि यह यूक्लिडियन दूरी का उपयोग करता है, और दूरी समारोह के रूप में हैवरसिन फॉर्मूला नहीं ?